腾讯混元参战大模型：“幻觉率”可降低30% 多个指标超越GPT3.5-热讯质量网

当前位置: 首页 > 财经

腾讯混元参战大模型：“幻觉率”可降低30% 多个指标超越GPT3.5

发布时间：2023-09-08 18:07:40 来源：澎湃新闻

“百模大战”新增又一巨头：腾讯官宣参战。

9月7日，在2023腾讯全球数字生态大会上，腾讯正式发布混元大模型，并宣布通过腾讯云对外开放。

(资料图片)

资料显示，腾讯混元大模型是腾讯自研的一款通用大模型，目前已经接入腾讯50多个业务测试，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

值得注意的是，这并非是腾讯首次公开大模型相关进展。此前6月19日，腾讯曾发布依托腾讯云TI平台打造行业大模型精选商店，提供MaaS（Model-as-a-Service）一站式服务，构建专属大模型及智能应用。

“大模型竞争还在马拉松的第一公里，这个行业太新了，不存在清晰的市场份额或占比。”9月7日，在接受澎湃新闻等媒体采访时，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生坦言，“大家动不动就喜欢发布通用大模型，在我看来这条路有点走偏了，不能解决产业实际问题和痛点。”

对于大模型落地前景，他也直言：“有些前沿投入和布局，可能要3到5年才能看到商业回报，现在谈大模型的商业前景还为时过早。”

腾讯的大模型“路线图”

今年上半年，多家大厂扎堆发布大模型，“百模大战”一度成为舆论焦点，而腾讯一直到9月份才发布通用大模型，似乎显得有些姗姗来迟。

“腾讯做大模型只看自己，不看别人。”9月7日，对于发布时间，腾讯副总裁蒋杰向澎湃新闻记者坦言，“混元大模型在腾讯内部已经内测很久，在推出时间上，没有考虑过和同行进行赛跑。”

从基本参数来看，目前腾讯混元的参数规模超千亿，预训练语料超2万亿tokens，具备中文创作能力，复杂语境下的逻辑推理能力，以及任务执行能力。

和其他模型相比，混元大模型的特点和优势是什么？澎湃新闻记者梳理发现，其最大特点是在解决“幻觉”能力上表现较为突出。所谓的“幻觉”，指的是大模型在回答提问时会出现答非所问、胡说八道的现象，腾讯混元大模型在预训练阶段通过“探真”算法进行事实修正，实测幻觉率可以降低30%-50%。

“其他厂商往往会通过知识图谱或是搜索外挂来让大模型的检索能力变得更加准确，但使用外挂会导致新的幻觉出现，因此腾讯决定在大模型预训练阶段就解决这个问题。”蒋杰表示。

此外，混元大模型还具备超长文本的处理能力，能够提供超过4000字的长文回答，而在同样的命题下GPT-3.5只能提供超过1000字的问答。在数据源头方面，蒋杰介绍，腾讯做小模型、大模型甚至大语言模型，都不会使用个人隐私数据。此外，腾讯的内容产品，也为腾讯混元大模型提供了大规模、多样化的语料库，能够学习到各类应用场景中的语言知识和语境理解能力。

在具体指标上，混元大模型在多个指标上超越了GPT-3.5，包括代码子项、STEM子项、高考题子项和数学子项上，但和GPT-4还有距离。蒋杰表示，国内的厂商在做大语言模型的时候，需要循序渐进，脚踏实地做好每一项技术突破，并且坦诚面对和国际厂商在技术上的一些差距。

外界好奇的是，为何腾讯在推出行业大模型后再次推出通用大模型？

此前汤道生曾提到，通用大模型可以在100个场景中，解决70%-80%的问题，但未必能100%满足企业某个场景的需求。相比盲目使用通用大模型，企业基于行业大模型构建自己的专属模型，也许是更优的选项。模型参数比通用大模型少，训练和推理的成本更低，优化也更容易。

对此，汤道生告诉澎湃新闻记者，推出时间较晚是因为腾讯一直在研发和应用的过程中。其实腾讯内部早已开始内测混元大模型，但在没有经历充分的应用融合和实践前不会对外公布其具体进展，最终公布的成品，是经过充分打磨后的，但依然会不断更新和迭代。

大模型商业化究竟路在何方？

在“百模大战”的热度略有减退后，大模型的实际落地效能成为外界考量的重点。

谈到混元大模型未来商业前景时，蒋杰坦言，在To B（企业）端产生商业收入还有待探索，因为目前混元大模型在面对成熟度和复杂任务的处理能力还不够全面，因此对于较多专业场景不能充分解锁，应用有待完善。

“混元大模型一开始就不是为了发布而发布，而是根据腾讯自身应用，例如微信、QQ等进行相关研发和匹配，提供互相深度融合的能力，才能抵消大模型背后的高昂设备、训练和人力成本。”蒋杰表示。

此前，百度智能云副总裁朱也在接受澎湃新闻记者在内的媒体采访时曾表示：“从衡量大模型本身的商业价值角度看，如果应用不起来，整个大模型很难持续下去，确实是需要投入，整个生态起来、应用繁荣很重要。我们判断，偏向于营销服务、办公提效这两个场景，可能会首先实现大规模落地，我认为接下来几个月能够看到应用逐渐落地，规模逐渐增大。”

对于大模型研发的高额成本，汤道生透露，腾讯内部对于资源分配有倾斜性，混元大模型是腾讯内部最重要的项目之一，因此会以第一优先级进行考虑，目前公司内部的人员配置和资源合作“跑得很顺利”，但大模型的竞争尚在马拉松的第一公里，可能要到3到5年后才能看到相应回报。

就在不久前，百度宣布“文心一言”向全社会全面开放，还将开放一批经过全新重构的AI原生应用，让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

混元大模型是否也将对外开放？对此，蒋杰表示，是否提供C端（消费者端）服务仅仅是时间和选择的问题，“目前我们还是侧重在内部应用场景中做尝试，TO C与否只是一种‘开关’，做好自身能力、提高准确性才是我们最为关注的。”

（文章来源：澎湃新闻）

上一篇：9月8日 14:33分飞鹿股份（300665）股价快速拉升下一篇：最后一页

腾讯混元参战大模型：“幻觉率”可降低30% 多个指标超越GPT3.5

腾讯混元参战大模型：“幻觉率”可降低30% 多个指标超越GPT3.5

【腾讯混元参战大模型：“幻觉率”可降低30%多个指标超越GPT3 5】“大

9月8日 14:33分 飞鹿股份（300665）股价快速拉升

分时图快速拉升意味此时存在大单买入，在大单的推动下，股价快速地上涨

快手汽车战事

本文经授权转自《晚点LatePost》（ID：postlate）今年上半年，国内汽车

河北省南宫市妇幼保健院服务百姓义诊活动

近日，河北省南宫市妇幼保健院积极开展“服务百姓健康”义诊活动，促进

抖音不能乱发！缅甸接连有人因此被逮捕

缅文媒体消息，9月6日下午，缅甸国家管理委员会发布消息证实，曼德勒省

月球是什么星 月球是什么星球,恒星还是行星

月球是卫星，是太阳系中第五大的卫星。月球的直径大约是地球的四分之一

郎酒集团董事长汪俊林：青花郎要成为飞天茅台后的第二大高端酱酒

24小时财经资讯平台，依托新锐财经日报《每日经济新闻》(NationalBusin

165家企业，510个展位！青岛制冷设备及冷链产业博览会举办

9月7日，以“新理念、新技术、新方案、新产品”为主题的2023中国（青岛

联化科技：9月7日融资买入674.79万元，融资融券余额2.57亿元

9月7日，联化科技（002250）融资买入674 79万元，融资偿还249 78万元，

孙立坚：区域经济发展势头和抗跌能力明显丨复旦-ZEW指数

孙立坚：区域经济发展势头和抗跌能力明显丨复旦-ZEW指数,复旦,孙立坚,z

iPhone 15新色配置曝光：支持快充

据最新曝光的消息，iPhone15系列机型的颜色配置和一些特性有所更新。iP

外滩大会对话大咖｜蚂蚁集团徐鹏：大模型市场很热 但我们需要冷静的看它带来的长期价值

外滩大会对话大咖｜蚂蚁集团徐鹏：大模型市场很热但我们需要冷静的看它

山海杨阳：黄金节奏转换完全拿捏，尾盘看上涨空间！

山海杨阳：黄金节奏转换完全拿捏，尾盘看上涨空间！周四公布的美国初请

光力科技（300480）9月8日主力资金净买入586.98万元

截至2023年9月8日收盘，光力科技(300480)报收于22 34元，上涨2 67%，换

华为捅破天上热搜 中国航天科技集团官现身科普

华为Mate60Pro有一项产品功能是Mate60标准版上没有的，那就是卫星通话

理想汽车在扬州成立新公司 经营范围含太阳能发电技术服务

证券时报e公司讯，企查查APP显示，近日，扬州车和家能源服务有限公司成

xx账户运行课程退费服务

xx账户运行课程退费服务

硬盘安装系统工具iso（硬盘安装系统）

1、是从网上下载下来的系统要硬盘安装？1 直接用WinRAR将ISO文件解压到

主动要求下场！梅西有多累？双线连轴转，赛后老干部式插兜

从他代表迈阿密国际首秀的第一场比赛7月22日绝杀蓝十字开始，到9月8日

江苏省泰州市海陵区市场监管局开展大米专项检查

中国质量新闻网讯为进一步加强大米生产经营者的监督管理，防范大米生产

又去追星！龚俊现身周杰伦天津演唱会观众席

9月7日，有网友在周杰伦天津演唱会观众席上偶遇龚俊。据悉，这是继7月

新冠“三阳”引关注，重复感染会更危险吗？

(邵萌)新冠疫情似乎已离我们远去，但病毒从未消失。近日，“新冠三阳的

中泰证券：持续看好临床CRO，板块有望持续快速增长

【中泰证券：持续看好临床CRO，板块有望持续快速增长】中泰证券近日研

深圳在多个区域发布暴雨红色预警

深圳在多个区域发布暴雨红色预警-为保障安全，深圳市三防办提醒广大市

我国显示产业平均增长率达21.6% 吸引投资超1.4万亿元

在世界显示产业大会，中国电子信息产业发展研究院发布了《中国新型显示

9月8日 14:33分飞鹿股份（300665）股价快速拉升

月球是什么星月球是什么星球,恒星还是行星

外滩大会对话大咖｜蚂蚁集团徐鹏：大模型市场很热但我们需要冷静的看它带来的长期价值

华为捅破天上热搜中国航天科技集团官现身科普

理想汽车在扬州成立新公司经营范围含太阳能发电技术服务