大语言模型中的涌现现象是不是伪科学？-热讯质量网

当前位置: 首页 > 热点

大语言模型中的涌现现象是不是伪科学？

发布时间：2023-06-14 23:56:33 来源：程序员客栈

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

(资料图片仅供参考)

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf

2.https://arxiv.org/pdf/2301.05217.pdf

上一篇：车圈撕起来，饭圈都得靠边站下一篇：最后一页

大语言模型中的涌现现象是不是伪科学？

大语言模型中的涌现现象是不是伪科学？

Datawhale干货作者：平凡@知乎，诺桑比亚大学，在读博士今天晚上，花了

车圈撕起来，饭圈都得靠边站

打榜、控评、反黑、应援……曾经只出现在娱乐圈里的各种饭圈化术语，开

关于成都，一些反直觉的地理冷知识 全球快资讯

*本文为「三联生活周刊」原创内容新刊出炉！点击上图，一键下单↑↑↑

10岁女孩都喜欢什么生日礼物

很难一概而论，因为每个女孩都有自己的爱好和兴趣。以下是一些可能

老九门2_全球快资讯

1、《老九门2》是慈文传媒出品的探险题材电视剧。2、该剧会在爱奇艺播

天天看点：人力资源社会保障部养老保险司：发展二、三支柱养老保险，实现保障方式多样性

App6月14日消息，人力资源社会保障部养老保险司相关负责人表示，发展二

诚志股份: 关于股东减持计划期限届满暨实施结果的公告 环球速递

诚志股份:关于股东减持计划期限届满暨实施结果的公告

2023年CQF考试地点是哪里-环球播报

2023年CQF考试是线上远程开卷考试模式，机器环境符合的学员即可参加考

环球观速讯丨近2000万！高州这个丝苗米加工中心正式投产

6月12日上午位于石鼓镇西基山村的广东浩田农业发展有限公司丝苗米加工

《异化黎明》同世界观短篇：落雪葬心·1 天天精选

寒风夹杂着雪花掠过山谷上空，伴随着鬼魅般的呼啸声与深彻骨髓的寒气又

日本核污水排海在即，福岛当地民众集会抗议

中新网6月14日电据福岛中央电视台报道，当地时间13日下午，日本福岛县

热门看点：近距离倾听消费者心声 峰米“夏日光影趴 ‘京’喜享不停”重装开业活动活动圆满结束

6月11日，激光智能投影领导者峰米投影（以下简称“峰米”）举办的“夏

世界微头条丨iOS 17 Beta版没有开放侧载：苹果高管回应

iOS17Beta版没有开放侧载：苹果高管回应

华体科技6月14日打开跌停

以下是华体科技在北京时间6月14日14:54分盘口异动快照：6月14日14点54

焦点观察：5月M1、M2增速双降，信贷少增5418亿元，流动性仍然宽松

5月M1、M2增速双降，信贷少增5418亿元，流动性仍然宽松,温彬,存款,央行

人民币兑美元中间价较上日调降68点

南方财经6月14日电，人民币兑美元中间价较上日调降68点至7 1566，创202

湖北恩施：“中西医结合经验”在国际卫生合作大会分享

湖北恩施：“中西医结合经验”在国际卫生合作大会分享---来自美国、英

数据不说谎 | 约基奇打出季后赛史上最强表现：乔丹詹皇也不如他 每日观察

数据不说谎|约基奇打出季后赛史上最强表现：乔丹詹皇也不如他,詹皇,nba

5月成功出海的中国手游：《崩坏：星穹铁道》登顶收入榜与增长榜 观速讯

格隆汇6月14日丨据SensorTower商店情报平台，得益于景元卡池的推出，《

从田间走来的钟埭儿童农民画

无论时光如何流转，家乡的味道是永远舍不掉的眷恋。作为民间艺术中一种

ps磨皮方法大全_ps磨皮方法

1、拥有白皙光滑的皮肤是每个女生毕生的梦想，然而在现实生活中，由于

htn是哪个机场（htn9）|天天快看

雪国列车要停了吗？奕国他乡重新发车腾讯视频-中国领先的在线视频媒体

每日动态!沪深两市成交额达3001亿元

南方财经6月14日电，据同花顺iFinD数据，开盘半小时，沪深两市成交额达

台达电：下半年AI服务器急单涌进

台达电：下半年AI服务器急单涌进：据台湾经济日报，台达电董事长海英俊

世界热点！多年口碑成“陌路”？一场风波看清娱乐圈人情冷暖，徐峥怎么了？

从老大哥吴京，到二哥沈腾，再到雷佳音、邓超，他们几位在电影圈如今的

关于成都，一些反直觉的地理冷知识全球快资讯

诚志股份: 关于股东减持计划期限届满暨实施结果的公告环球速递

热门看点：近距离倾听消费者心声峰米“夏日光影趴 ‘京’喜享不停”重装开业活动活动圆满结束

数据不说谎 | 约基奇打出季后赛史上最强表现：乔丹詹皇也不如他每日观察

5月成功出海的中国手游：《崩坏：星穹铁道》登顶收入榜与增长榜观速讯