1月31日消息,Microsoft AI公司首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)昨日(1月30日)在X平台发布推文,宣布所有Microsoft ...
摘要 2024年诺贝尔物理学奖授予约翰·霍普菲尔德和杰弗里·辛顿,这对很多人来说是出乎意料的。文章将从统计物理的视角,从伊辛模型出发,逐步介绍霍普菲尔德和辛顿的主要贡献,其中包括Hopfield模型、玻尔兹曼机、非监督学习,以及现代生成模型。还将回顾统计物理和机器学习在20世纪末期的精彩合作历程,并对未来物理与机器学习交互领域的发展方向进行简单展望。
除了指令微调、代码专项微调、多任务学习与多目标损失函数等拉升AI Coding能力的传统艺能外,Claude 3.5 Sonnet的强代码能力,还有部分来自于其长上下文能力,有助于模型评估需求并生成量身定制的解决方案。
最近,一家来自中国杭州的初创公司 深度求索 (DeepSeek)凭借发布的两款 大语言模型 (LLM),在全世界科技界掀起波澜,这两款模型的性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却只是其一小部分。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元。业界认为这是受到中国AI大模型DeepSeek人工智能模型冲击,导致美国芯片股集体下跌,英伟达受到最严重冲击。DeepSeek-R1API服务定价为每百万输入tokens1元/4元 ...
DeepSeek的低成本高效能模式彻底颠覆了硅谷的“算力至上”逻辑。其最新模型仅需600万美元的算力成本,远低于美国同行的数十亿美元投入,这直接导致美股科技股集体暴跌。截至当地时间1月27日收盘时间,英伟达股价单日暴跌17%,市值蒸发近6000亿美元 ...
物理学从没有错失工业革命浪潮,在人工智能急速发展的今天也一样。事实上,物理学对神经网络研究历史同样悠久,如霍菲尔德的联想记忆网络,也是2024年诺贝尔物理学奖的工作。而在感知学习、无监督学习、神经动力学方面,都存在物理学思想的深刻体现。 撰文 | 黄海平(中山大学物理学院) 神经网络在当今人工智能研究和应用中发挥着不可替代的作用。它是人类在理解自我 ...