培养皿中的人类神经元:合成生物智能的突破 它们在没有人类或计算机输入的情况下掌握了Pong。 在《Neuron》期刊的一项开创性研究中,研究人员展示了在实验室培养皿中培养的人类和小鼠神经元可以学习玩经典的1970年代视频游戏Pong。 这一显著成就由澳大利亚墨尔本的Cortical Labs的Brett Kagan博士及其团队领导,展示了合成生物智能的潜力,并为理解神经元如何处理信息和适应动态环境开辟了新的途径。 该系统被称为“DishBrain”,将活的脑细胞与先进技术相结合,提供了对智能、学习以及在神经科学和人工智能(AI)中的潜在应用的深入见解。 DishBrain系统:生物与技术的融合 DishBrain系统是一个开创性的平台,集成了大约800,000个活的神经元——这些神经元来自胚胎小鼠大脑或人类诱导多能干细胞——到一个微电极阵列上。这个阵列是一个放置在培养皿中的硅芯片,作为生物神经元与数字环境之间的接口。电极可以同时向神经元传递电冲动以刺激它们,并记录它们的活动,形成一个闭环系统,神经元根据其行为接收实时反馈。 在实验中,神经元连接到运行简化版Pong的计算机上,这是一种类似网球的游戏,玩家移动一个球拍来回击球。微电极阵列被分为感官和运动区域。感官区域的电极发送信号以指示球的位置,而运动区域的电极将神经活动解释为移动球拍上下的命令。为了使任务可行,研究人员调整了游戏:球拍更大,球移动更慢,并且没有对手,目标是最大化回合长度而不是赢得比赛。 通过反馈学习:自由能原理 神经元在短短五分钟内学会了玩Pong,并随着时间的推移提高了表现。这种快速学习是由根植于自由能原理的反馈机制驱动的,这一理论由共同作者Karl Friston教授提出。根据这一原理,神经元寻求最小化其环境中的不可预测性(或熵)。在实验中,当神经元成功击中球时,它们会收到可预测的电刺激,增强连接性并作为奖励。当它们未能击中时,它们会收到不可预测的、更强烈的刺激,这会干扰神经网络并鼓励适应以避免此类结果。 在20分钟内,神经元提高了维持回合的能力,人类神经元的表现优于小鼠神经元,达到了显著更长的回合时间。这一差异与先前的研究一致,表明人类神经元的信息处理能力大于啮齿动物神经元。神经网络中电活动的同步“尖峰”随着每次成功击打而增强,表明神经元正在调整其行为,以更一致地击中球。 对神经科学和人工智能的影响 DishBrain实验是理解神经元如何在生物体之外学习和处理信息的重要里程碑。Kagan博士表示,这项工作展示了“合成生物智能”,其中神经元表现出类似于感知的目标导向行为——在这里定义为感知和响应环境的能力,但并不等同于意识。它们令人兴奋。
42.15K