去年底,随着ChatGPT的横空出世,AI浪潮俨然来袭,国内行业巨头纷纷入局,大模型领域战况激烈愈发激烈,想要实现破局,致敬和追赶ChatGPT这一行业标杆,不仅要有“硬实力”,更要通过“巧方法”,在特定方面实现“定点爆破”和弯道超车。
而企业的技术积累、发展禀赋各不相同,这种“破局”妙法也不可一概而论。不过让人眼前一亮的是,最近,科大讯飞这家始终致力于深耕国内AI技术,在智能语音、自然语言理解、计算机视觉等核心技术上处于前列的行业“领跑者”,率先让业界看到了新火花。
5月6日,讯飞星火认知大模型成果发布会在合肥召开,“星火”认知大模型正式发布,四大行业应用成果也落地演示。此次发布会可谓业界瞩目,无论“星火”,还是率先落地的应用成果,都引发现场掌声雷鸣不断。
不过,如若细品大模型的发布的一些“小细节”,更能让人感受到“意外之喜”。不妨让我们回顾下发布会上,演示者对“星火”的三次“刁难”。
“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。”随后,“星火”便脑洞大开,为我们娓娓道来一则生动故事。
“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”,面对这一则让“大模型”头大的难题,“星火”却“学霸气质”尽显,作答行云流水,步骤分明。
“菠菜和豆腐能不能一起吃”、“量子科技有哪些应用领域?”,面对跨领域的灵活问题,“星火”也从容自如,逻辑清晰。
在这些方面,“星火”的智慧涌现惊艳全场。据悉,在文本生成和数学能力上,星火认知大模型已经国内显著领先,且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平,处于国内领先水平。
不同维度的“巧突破”,特定赛道上的率先追赶,彰显了科大讯飞在这些领域上的“硬实力”,这无疑首先来自讯飞为认知大模型“智能涌现”所做出的核心技术储备:从2011年承建语音及语言信息处理国家工程实验室,再到多年以来在各个国际AI比赛中的成果井喷,一路走来,讯飞在AI的语音识别、科学知识、阅读理解、多模态等方面,已经有着雄厚的技术支撑。
其次,完善的算力设施、成建制、无内耗的优秀研究团队、工程上的长期投入与丰硕成果,以及长期积累下的海量中文语料、行业性的高质量数据,也都为此次亮剑“星火”技术,提供依托。
可另一方面,优秀的技术是“实”,却不能成为评价成果的标准,也就是“名”,“有名有实”才是“星火”本色。肯定有人要质疑,为什么科大讯飞,你“能说”在某些领域上,讯飞星火有着能够比肩甚至超越业界老前辈ChatGPT的名义?
这当然不是空口无凭,而是有公正“裁判”来“打分”。科大讯飞董事长刘庆峰在发布会上便表示:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系”。在这一方面,科大讯飞开展广泛的业界合作,通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。
在致敬和追赶ChatGPT的道路上,公正、科学的评测体系,无疑为“星火”的燎原之势提供了严格的“坐标参照系”,而这无疑也是“巧实力”的一部分:不蛮干、胡干、硬干,而是追求精准定位,定向突破,实现“巧破局”。
精准定位,谋求“巧破局”,这也是本次发布会的重点内容。在随后的演示里,刘庆峰坦言,目前纯大模型有着许多技术上的缺陷与不足,这也是“星火”乃至业界都难以避免的。由于大模型基于深度学习算法,多采用历史数据进行训练,因此对新知识往往更新不足,而且会出现对于时事类问答的“张冠李戴”,以及在史实、传统典籍上的回答容易“编造情节”,甚至会出现将“白龙马”编造为“龙族公主”这种让人哭笑不得的回答。
然而正是因为能够清晰定位目前存在的不足,才能针对这些难点、痛点,发挥“巧实力”,率先攻坚克难的尝试。刘庆峰也向大家展示了,“星火”今年发展“振奋人心”的三个里程碑:在6月9日,突破开放式问答,能够实时对话。实现多轮对话能力和数学能力再升级;在8月15日,突破代码能力,多模态交互再升级;再10月24日,通用模型,能够对标ChatGPT,在中文上实现超越,在英文上旗鼓相当,而这“就是用我们刚才讲的科学系统的评测方法”。
“燃烧最亮的火把,要么最先燎原,要么最先熄灭”,谈起科大讯飞的技术愿景,刘庆峰信心满满。相信在未来,凭依系统性创新和技术能力,讯飞“星火”,也将为业界带来更多新可能。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。