Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Amjad Masad
Giám đốc điều hành @replit. nhà văn minh
Thú vị. Tại sao Fukushima không được tôn vinh như các nhà nghiên cứu AI phương Tây?

Jürgen Schmidhuber22:05 3 thg 8
Ai đã phát minh ra mạng nơ-ron tích chập (CNN)?
1969: Fukushima đã có ReLU liên quan đến CNN [2].
1979: Fukushima đã có kiến trúc CNN cơ bản với các lớp tích chập và các lớp giảm mẫu [1]. Chi phí tính toán cao gấp 100 lần so với năm 1989, và gấp một tỷ lần so với ngày nay.
1987: Waibel đã áp dụng thuật toán lan truyền ngược của Linnainmaa năm 1970 [3] cho TDNN chia sẻ trọng số với các tích chập 1 chiều [4].
1988: Wei Zhang và các cộng sự đã áp dụng CNN 2 chiều được huấn luyện bằng lan truyền ngược "hiện đại" cho nhận diện ký tự [5].
Tất cả những điều trên đã được công bố tại Nhật Bản từ 1979-1988.
1989: LeCun và các cộng sự đã áp dụng lại CNN cho nhận diện ký tự (mã bưu điện) [6,10].
1990-93: Phương pháp giảm mẫu của Fukushima dựa trên trung bình không gian [1] đã được thay thế bằng max-pooling cho TDNN 1-D (Yamaguchi và các cộng sự) [7] và CNN 2-D (Weng và các cộng sự) [8].
2011: Muộn hơn, nhóm của tôi với Dan Ciresan đã làm cho CNN max-pooling thực sự nhanh trên GPU NVIDIA. Năm 2011, DanNet đã đạt được kết quả nhận diện mẫu siêu nhân đầu tiên [9]. Trong một thời gian, nó đã có độc quyền: từ tháng 5 năm 2011 đến tháng 9 năm 2012, DanNet đã thắng mọi thử thách nhận diện hình ảnh mà nó tham gia, 4 lần liên tiếp. Tuy nhiên, điều này chủ yếu liên quan đến kỹ thuật và mở rộng những hiểu biết cơ bản từ thiên niên kỷ trước, tận dụng phần cứng nhanh hơn rất nhiều.
Một số "chuyên gia AI" tuyên bố rằng "làm cho CNN hoạt động" (ví dụ, [5,6,9]) quan trọng như việc phát minh ra chúng. Nhưng "làm cho chúng hoạt động" phần lớn phụ thuộc vào việc phòng thí nghiệm của bạn có đủ tiền để mua những máy tính mới nhất cần thiết để mở rộng công việc ban đầu. Điều này cũng giống như ngày nay. Nghiên cứu cơ bản so với kỹ thuật/phát triển - R so với D trong R&D.
TÀI LIỆU THAM KHẢO
[1] K. Fukushima (1979). Mô hình mạng nơ-ron cho cơ chế nhận diện mẫu không bị ảnh hưởng bởi sự dịch chuyển vị trí — Neocognitron. Trans. IECE, vol. J62-A, no. 10, pp. 658-665, 1979.
[2] K. Fukushima (1969). Trích xuất đặc trưng hình ảnh bằng một mạng nhiều lớp các phần tử ngưỡng tương tự. IEEE Transactions on Systems Science and Cybernetics. 5 (4): 322-333. Công trình này đã giới thiệu các đơn vị tuyến tính đã được điều chỉnh (ReLUs), hiện đang được sử dụng trong nhiều CNN.
[3] S. Linnainmaa (1970). Luận văn Thạc sĩ, ĐH Helsinki, 1970. Ấn phẩm đầu tiên về "lan truyền ngược hiện đại", còn được gọi là chế độ ngược của phân biệt tự động. (Xem tổng quan về lan truyền ngược nổi tiếng của Schmidhuber: "Ai đã phát minh ra lan truyền ngược?")
[4] A. Waibel. Nhận diện âm vị sử dụng Mạng nơ-ron độ trễ thời gian. Cuộc họp của IEICE, Tokyo, Nhật Bản, 1987. Lan truyền ngược cho TDNN chia sẻ trọng số với các tích chập 1 chiều.
[5] W. Zhang, J. Tanida, K. Itoh, Y. Ichioka. Mạng nơ-ron nhận diện mẫu không thay đổi và kiến trúc quang học của nó. Proc. Hội nghị thường niên của Hiệp hội Vật lý ứng dụng Nhật Bản, 1988. CNN 2 chiều đầu tiên được huấn luyện bằng lan truyền ngược, với ứng dụng cho nhận diện ký tự tiếng Anh.
[6] Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard, L. D. Jackel: Lan truyền ngược áp dụng cho nhận diện mã bưu điện viết tay, Neural Computation, 1(4):541-551, 1989. Xem thêm Sec. 3 của [10].
[7] K. Yamaguchi, K. Sakamoto, A. Kenji, T. Akabane, Y. Fujimoto. Một mạng nơ-ron cho nhận diện từ độc lập không phụ thuộc vào người nói. Hội nghị quốc tế lần thứ nhất về xử lý ngôn ngữ nói (ICSLP 90), Kobe, Nhật Bản, tháng 11 năm 1990. Một TDNN tích chập 1 chiều sử dụng Max-Pooling thay vì trung bình không gian của Fukushima [1].
[8] Weng, J., Ahuja, N., và Huang, T. S. (1993). Học nhận diện và phân đoạn các đối tượng 3-D từ hình ảnh 2-D. Proc. Hội nghị quốc tế lần thứ 4 về thị giác máy tính, Berlin, pp. 121-128. Một CNN 2 chiều mà các lớp giảm mẫu của nó sử dụng Max-Pooling (đã trở nên rất phổ biến) thay vì trung bình không gian của Fukushima [1].
[9] Năm 2011, CNN nhanh và sâu dựa trên GPU gọi là DanNet (7+ lớp) đã đạt được hiệu suất siêu nhân đầu tiên trong một cuộc thi thị giác máy tính. Xem tổng quan: "2011: DanNet kích hoạt cuộc cách mạng CNN sâu."
[10] Cách 3 người đoạt giải Turing đã công bố lại các phương pháp và ý tưởng chính mà những người sáng tạo của chúng không được ghi nhận. Báo cáo kỹ thuật IDSIA-23-23, Phòng thí nghiệm AI Thụy Sĩ IDSIA, 14 tháng 12 năm 2023. Xem thêm video YouTube cho Lễ trao giải Bower 2021: J. Schmidhuber ca ngợi Kunihiko Fukushima.

26,11K
Có rất nhiều cuộc thảo luận về tác động của lập trình AI đối với các startup và doanh nghiệp lớn.
Nhưng tác động đối với các doanh nghiệp nhỏ thì sâu sắc hơn.
Doanh nghiệp gia đình này cần phần mềm tùy chỉnh để ước tính nhu cầu sơn nhà.
Được xây dựng trên Replit và đã tiết kiệm được hàng tháng trời và hàng chục nghìn đô la.
27,28K
Tin tặc số một thế giới giờ đây là một đại lý AI.

XBOW06:02 1 thg 8
XBOW hiện là hacker số 1 trên HackerOne, toàn cầu.
Lần đầu tiên, AI pentester tự động của chúng tôi đứng đầu bảng xếp hạng toàn cầu.
Tuần tới tại #BlackHat, chúng tôi sẽ trình diễn trực tiếp:
Chúng tôi sẽ chạy thời gian thực trên các chương trình HackerOne—hãy đến xem XBOW tìm ra các lỗ hổng.
📍 Gian hàng 3257

125,2K
"Siêu trí tuệ" được coi là một khoảnh khắc kỳ dị mà nó quá đột phá đến mức khó có thể dự đoán điều gì sẽ xảy ra tiếp theo. Một khoảnh khắc đáng sợ đến nỗi một số người nghĩ rằng nó có thể kết thúc thế giới.
Nhưng bây giờ chúng ta đã bắt đầu nói về "siêu trí tuệ cá nhân" - một người bạn ảo trên Facebook 😂

AI at Meta30 thg 7, 2025
Hôm nay, Mark đã chia sẻ tầm nhìn của Meta về tương lai của siêu trí tuệ cá nhân cho mọi người.
Đọc toàn bộ bức thư của anh ấy ở đây:
118,97K
Một CEO của một công ty đại chúng đã nói với tôi rằng việc lập trình AI đã có tác động không đáng kể đến các đội ngũ kỹ sư của ông, thay vào đó, sự chuyển mình thực sự đã diễn ra ở các đội ngũ sản phẩm và thiết kế của họ khi sử dụng Replit.
Tôi đã hỏi ông ấy làm thế nào để ông hòa giải điều này với những CEO nói rằng 25-50% mã được tạo ra bởi AI?
Ông ấy nói rằng điều đó cũng đúng trong trường hợp của họ—AI thực sự tạo ra rất nhiều mã của họ—nhưng thời gian tiết kiệm được trong việc tạo mã lại bị mất đi trong việc gỡ lỗi, khôi phục lỗi và kiểm toán bảo mật. Vì vậy, nếu bạn đo thời gian để giao hàng, số PR được hợp nhất, hoặc bất kỳ chỉ số cấp cao nào khác, bạn sẽ không thấy bất kỳ tác động nào.
Trong khi đó, các đội ngũ không kỹ thuật của ông đã có được một sức mạnh siêu phàm hoàn toàn mới là có khả năng tạo ra phần mềm. Việc tạo mẫu với Replit làm cho tốc độ lặp lại nhanh hơn rất nhiều trước khi đến tay kỹ sư. Và các đội ngũ không sản phẩm—như HR—lần đầu tiên có thể giải quyết các vấn đề mà các nhà cung cấp không có giải pháp chính xác mà họ đang tìm kiếm.
Tôi đã rất ngạc nhiên khi nghe phần về các đội ngũ kỹ sư, và tôi chắc chắn rằng mỗi công ty sẽ khác nhau, nhưng điều đó đã làm rõ tác động sâu sắc mà các tác nhân lập trình đang có đối với những người không kỹ thuật.
829,11K
Mô hình định giá tốt nhất cho AI là dựa trên kết quả.
Ví dụ, tính phí khi AI đóng một vé hỗ trợ.
Nhưng rất ít thứ hoạt động theo cách này khi nhiệm vụ tương đối ngắn hạn và điều kiện hoàn thành rõ ràng.

Amjad Masad29 thg 7, 2025
Các gói đăng ký AI "sử dụng không giới hạn" về cơ bản là không bền vững cho các sản phẩm có tính tác động vì bất kể giá token rẻ đến đâu, người dùng vẫn sẽ muốn tiêu thụ nhiều hơn.
84,07K
Amjad Masad đã đăng lại
Tôi đã dành vài giờ sáng nay trên Replit để xây dựng một cái gì đó (bắt đầu với mã từ một artefact của Claude) và tôi thật sự bị ấn tượng bởi Replit.
Đó thực sự là một trải nghiệm phần mềm kỳ diệu, cả về giao diện người dùng phía trước và phía sau.
Giờ tôi sẽ làm tất cả việc lập trình vibe của mình ở đó.
19,46K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất