腾讯新闻《一线》 作者 肖枫
6月19日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。
与目前国内流行的通用大模型不同,腾讯云将聚焦点放在了具体产业场景上,将模型能力快速、低成本地应用到具体的业务场景,以此来解决企业在接入、训练、部署和应用通用大模型时面临着训练成本高昂、数据安全、专业知识不足等现实挑战。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生指出,就模型而言,比起通用大模型,企业更需要针对具体行业的大模型,并结合企业自身的数据进行训练和精调,以打造出更实用的智能服务。企业对提供的专业服务要求高且容错性低,因此使用的大模型必须具备可控、可追溯和可修正的特点,并经过反复充分的测试。
其次是数据的重要性。数据是大模型的原材料,针对具体场景,数据的覆盖和质量至关重要。在模型的开发过程中,需要关注敏感数据的保护和安全合规,并有效管理大量的数据和标签,不断进行测试和模型的迭代。腾讯云也推出基于TI平台的行业大模型精调解决方案,帮助模型开发者和算法工程师高效率、高品质、低成本地处理数据,创建和使用大模型。
在应用方面,腾讯自身也应用行业大模型,优化自身企业级应用,为用户提高工作效率。例如,通过基于行业模型的智能小助手,腾讯会议可以协助用户进行日程安排、会管、会控等操作,并自动生成智能总结摘要,提升会议的效率。腾讯企点智能客服和AI代码助手等应用也通过行业模型的训练和精调,提供更精准、详细的回答和高效的编程辅助。
最后是算力的支持。算力是模型持续运转的基础,高性能、高弹性和高稳定的算力对于大模型的训练和使用至关重要。腾讯云也提供新一代高性能计算集群,为客户提供稳定计算、高速网络与专业运维。同时,推出面向AI运算的向量数据库,支撑对图像、音频和文本等非结构化数据的高效处理,数据接入AI的效率,也比传统方案提升10倍。
在2023年4月,腾讯云发布了专为大模型训练设计的新一代HCC高性能计算集群,采用最新一代的腾讯云星星海自研服务器,具备业界最高的3.2Tbps互联带宽,算力性能提升了3倍。此外,腾讯云即将推出向量数据库(Tencent Cloud VectorDB),源自腾讯集团每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适用于AI运算、检索,数据接入AI的效率也比传统方案提升10倍。这些创新将为客户的模型训练提供强大的支持和动力。
不过,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声也指出,今年以来,随着技术和算力的发展,大模型的参数量在不断上涨,但腾讯云始终关注如何用最有效、最低成本的手段去解决客户的问题。
依托在高性能算力及大模型能力方面的积累,腾讯云已经携手央视总台、福建大数据集团、上海大学等行业头部企业,在大模型行业应用方面共创了50多个行业解决方案,在智能客服、OCR、跨模态检索等领域有广泛实践。
汤道生表示,大模型只是开端,AI与产业的融合,将绽放出更有创造力的未来。生态共建是AI发展的有效路径,腾讯将坚持生态开放,为企业提供高质量模型服务,同时支持客户多模型训练任务,加速大模型在产业场景的创新探索。