4月17日,昆仑万维正式发布千亿级大语言模型「天工」并启动邀请测试,已有媒体记者获得邀请,实测后发现,「天工」在“文科”方面非常有天分,部分表现甚至超出了ChatGPT3.5。
「天工」由昆仑万维与国内领先的AI团队奇点智源联合研发,是国内首个对标ChatGPT的双千亿级大语言模型,「天工」通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。「天工」发布后,财联社记者实测发现,「天工」在很多方面不逊于ChatGPT3.5。
记者测试了多个问题。其中,关于脑筋急转弯的提问:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,三儿子叫什么名字?
「天工」3.5一次就答对了。
同样的问题,记者问ChatGPT(3.5版本),虽也回答正确,但多了一句灵魂拷问:所以小明的名字是什么。
一道灯谜题,提问:说它是头牛,不会拉犁头,说它力气小,背着屋子走。(打一个动物)
「天工」3.5又一次答对了。
而ChatGPT(3.5版本)并没有答对。
面对“蒸包子”问题,「天工」3.5也回答的头头是道,颇为“理性”。
ChatGPT(3.5版本)则给出了略微不同的回答。
除了文科生的题目外,「天工」也能完成代码。
记者尝试使用「天工」3.5写代码,提问:用Scala实现并查集,在得到回答后,又再次提问:用Java再写一遍。随后记者拿给程序员朋友检查,对方称结果是对的,还表示这一问题相对基础,写代码能力如何还要视具体需求,若能进行多轮对话联系上下文修改,会是个辅助业务的“好帮手”。
以上足见「天工」3.5在语义理解、逻辑推理上表现优秀。
方汉表示,目前大家比较喜欢考验大模型的问题,如脑筋急转弯、段子和网络梗,大部分都属于语义问题。脑筋急转弯是一种语言游戏,用它来考大模型也可以,也是一个很有娱乐性的话题,“但从大模型落地的角度,我们要更多从人类的通用治理上考核大模型,考核一种普适性的能力。”
据悉,「天工」3.5目前最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平及较强记忆能力。如此强大的能力,不禁令人好奇,「天工」是如何锻造而成?
谈及「天工」的诞生,昆仑万维CEO方汉表示,昆仑万维业务包括浏览器、社交娱乐、新闻、游戏等板块,和内容的关联性都非常强,所以对内容生成方面的技术进展一直非常敏感,从2020年起就开始在音乐AI领域投入。而奇点智源早在2020年就意识到AI技术在未来的应用潜力,当时GPT3诞生后,奇点判断这是内容生成领域一个里程碑,因此果断投入了大规模的算法和算力资源,聚集了一支高水平的科研团队,开始构建自己的技术矩阵。
到了2022年,昆仑万维准备从音乐AI往多模态AI拓展,同时奇点智源也越发强烈地意识到千亿级大模型是AGI的一个突破口,并且只有自研千亿级大模型,才能建立核心壁垒、掌握主动权。所以双方一拍即合,因此「天工」是个水到渠成的选择。
「天工」犹如黑马出世,其优秀表现令人对昆仑万维在AIGC方面的布局具有了更大的想象空间。
在4月12日披露的年报中,昆仑万维表示展望未来十年将坚定的“All in”AGI(通用人工智能)与AIGC,2023年将不断加强在相关方向的技术积累,以建立昆仑万维在人工智能领域的领先优势。人工智能技术一方面将作为新的发展引擎,全面激活内部各业务,助推公司业务发展进入新纪元;另一方面也将为个人及企业用户定制化输出AIGC能力,帮助各行业提效转型,实现高质量发展。
昆仑万维是中国领先的互联网平台出海企业。面对互联网行业快速的发展变革,公司积极转型,经过多年发展,现业务已经覆盖包括信息分发、社交、娱乐、元宇宙、游戏及AIGC 等多个领域,用户遍及全球一百多个国家和地区,累计月活跃用户近 4 亿,发展潜力巨大。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。