近年来,在基础创新和技术应用层面的共同努力下,AI(人工智能)领域正发生“一日千里”般的技术突破,AI技术革命的大门已经向我们打开。
如果说蒸汽机是工业革命的引擎、计算机是科技革命的引擎,在这轮AI技术革命中,“通用大模型”无疑是驱动时代进步的最强动力。它就像是人类智慧的"超级压缩包"+"万能工具箱",既是人类创造的工具,也将成为人类塑造未来文明的伙伴。
当下,中国已成为全球范围内AI技术创新的重要策源地。在这一过程中,作为经济高质量发展微观基础的上市公司,正全力攻坚大模型技术,为中国的AI技术大厦奠定自主可控的“基石”。
共迎AI时代 上市公司在行动!
今天,让我们关注上市公司科大讯飞(SZ002230)20多年来专注人工智能,并在自主可控大模型领域取得突破性成果的精彩故事。
近年来,国内诞生了不少在全球范围内都名列前茅的AI大模型,体现了中国在AI领域的实力。不过,在肯定技术进步的同时,我们也要看到,这些大模型在训练中对进口算力存在一定程度上的依赖。
如何构建自主可控的大模型研发能力?自进入AI领域伊始,科大讯飞就启动了对国产算力大模型“无人区”的持续探索,这样的探索很不容易,但是必须有人去做。
正如科大讯飞董事长刘庆峰所说:“都说前人栽树后人乘凉,总得有人去做那个栽树的人。”
一 、20多年厚积薄发 奠定坚实基础
科大讯飞选择探索“无人区”之路,基础在于自创立20多年来的厚积薄发。
2010 年,科大讯飞就启动了基于深度神经网络的语音识别模型探索。2012年初,BN-feature 和 DNN-HMM 两套深度学习方案都全面上线于讯飞输入法和语音开放平台,助推科大讯飞成为国内首个上线深度学习语音识别商业系统的机构。经过测试,该新系统方案结合数据的涟漪效应,把实际场景中语音识别的准确率从 60% 提升到88% 左右,基本迈入了实用门槛,显著提升了语音输入等功能的用户体验。
2014 年年初,刘庆峰提出,公司的业务要从当前的语音进一步扩展为挑战更大的认知智能,也就是从能听会说到能理解会思考。
2014 年,科大讯飞确定了认知智能战略,提出要让机器“能理解会思考”;2015 年,科大讯飞年度发布会的主题是“AI 复始,万物更新”,从技术顶天、应用落地的层面,全面吹响了向人工智能进军的号角。
二 、在大模型领域选择做“栽树的人”
科大讯飞构建自主可控的大模型研发能力,是一条难走的路,也是一条必须要走的路。
科大讯飞2019年就被列入所谓“实体清单”,各个AI研发机构普遍走的“囤卡”之路对于科大讯飞来说早已堵死。这逼着科大讯飞和华为一起做全国产算力化平台“飞星一号”、“飞星二号”,在国产卡基础上构建大模型底座能力。
在刘庆峰看来,构建自主可控的大模型研发能力,通俗的说就是把“一件事变成两件事”:第一件事是大模型训练,别人做讯飞也要做;第二件事只有讯飞要做,就是不断调整算力平台。如果用非国产卡,生态体系是健全的;可是自建算力平台是“第一个吃螃蟹”,等于要再趟一个“无人区”。
根据刘庆峰估算,第二件事至少要耗掉了30%精力。尽管如此,刘庆峰依然坚定的说:“都说前人栽树后人乘凉,总得有人去做那个栽树的人。”
科大讯飞的大模型被命名为“星火”。刘庆峰对这个词感情很深,和那句“燃烧最亮的火把,要么率先燎原,要么最先熄灭”呼应,都是属于科大讯飞的英雄主义。
2023年5月6日,刘庆峰带着星火大模型“跑步”入场,立下了全面对标 ChatGPT 的“军令状”:当时,能容纳1500人的发布会主场馆座无虚席,就连过道上都挤满了人,人们在一阵阵惊呼声中听完2个多小时的发布会,而线上累计观看人次超过 3345 万,随着星火大模型演示着各种各样的任务,几乎每隔几分钟,现场就爆发出一阵热烈的掌声。
科大讯飞提出通用人工智能应当具备七大维度能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。而星火大模型在每个能力上的表现,都堪称惊艳。
自讯飞星火大模型诞生以来,基于全国产算力底座,科大讯飞对其进行持续训练。它用更少的算力,更小的尺寸,达到业界一流效果。以科大讯飞于今年3月3日升级的星火X1为例,作为当前唯一采用全国产算力训练的深度推理大模型,星火X1以70B参数量实现了在数学能力上全面对标OpenAI o1,解决了国产算力大规模集群训练在深度思考和长思维链推理方面面临的全新挑战,且在中文数学的各项任务中实现领先。
三 、让AI成为每个人的“好参谋”和“好助手”
“2023年是‘大模型元年’、2025年是‘AI应用元年’”。呼应时代趋势,科大讯飞正基于自主可控的通用底座大模型,在2025年全面推动大模型应用落地,让“高大上”的AI技术成为每个人生活中的“好参谋”和“好助手”,助力AI平权和技术普惠。
——今年3月3日,基于星火X1,科大讯飞首发星火医疗大模型X1。目前,星火医疗大模型X1正式应用于AI健康助手“讯飞晓医”,与个人健康档案的融合更加深入,在用户健康咨询时,它能深度洞察用户健康状况并思考潜在需求,有效解决了过往AI医疗咨询中“建议答案宽泛不实用”的痛点,给出的医疗建议更加个性化、更具体实用。
——基于讯飞星火X1的全面升级,面向备授课的星火教师助手也进一步升级,给出了更清晰、更详实的AI教学思路。升级后的星火教师助手,实现了教育教学中AI工具的“思维可视化”,从学生对基础问题的提问,到复杂问题的进阶探究都有迹可循,更加有助于教学创新和学生高阶思维能力培养。
——基于讯飞星火底座能力,科大讯飞的多语种多方言能力持续突破:星火语音大模型支持全球74个语种的免切换,中国方言语音识别覆盖288个地市202种方言,首次实现全国地级市方言全覆盖;破解强干扰场景下的语音识别难题,首批37个主流语种效果超过OpenAI Whisper V3;星火多语言大模型还能支持中英以外的8个语种,为世界提供更多的选择。
“2025年,我最希望推动完全自主可控的通用人工智能生态体系建设。”在不久前召开的全国两会期间,作为全国人大代表,刘庆峰提出的这样一条建议,成为舆论场热议话题。
刘庆峰说,在自主可控平台上发展通用底座大模型并达到全球顶尖水平,特别是在国计民生相关重点领域对标并实现超越,对我国在未来全球人工智能产业竞争中掌握主动权、赢得战略优势至关重要。
当前,通用大模型底座的天花板被持续打开,应用场景落地已进入红利兑现期。科大讯飞将聚焦自主可控的底座能力和重点应用赛道,以长期主义精神保持战略定力,以更少成本、更低算力、更高效率推动AI落地。