60%中国企业想用生成式AI，障碍在哪？

天天找好吃队长 · 发表于 2024-5-20 00:44

文/观察者网周毅，编辑张广凯

“前不久Gartner（国际咨询机构）发布的调研显示，超过60%的中国企业计划在未来12至24个月内部署生成式AI，可以看到企业对应用大模型技术的迫切感。那么如何将想法变为现实，帮助企业打破大模型技术落地障碍？在过去一年和广大客户的共创中，我们发现：要让企业用上大模型，用好大模型，还需要解决三大挑战。”

在5月17日腾讯云生成式AI产业应用峰会上，腾讯云副总裁、腾讯云智能负责人吴运声如是说。

吴运声表示，随着大模型技术的快速发展，人工智能已成为企业数字化转型的核心动力。在加速大模型产业创新，推动企业应用大模型技术的过程中，我们需面对降低使用门槛、提高平台适配性、保障安全合规三大挑战。这就需要打造一套大模型时代的原生工具链，助力企业更高效、简单地将大模型能力应用于生产、销售和服务等场景。

观察者网摄

针对这些挑战，腾讯云正式发布三大AI引擎，助力企业在知识服务、图像和视频创作上提质提效。在当天的发布会上，腾讯还公布了混元大模型的最新进展，并宣布多个模型将开源。据悉，本月底，腾讯还将推出基于混元大模型打造的C端助手App“腾讯元宝”。

“5分钟打造一款知识服务应用”，腾讯云发布三大AI大模型引擎

如何找准场景、快速部署，缩短从基础模型到产业应用的距离。这是一个各界长期探讨的问题。

过去一年来，各行各业对模型的需求在不断变化：大模型不仅仅要处理单纯的文字，还需要处理图片、视频等多种信息。大模型的能力竞争，已经从单一文生文，拓展到文生图、文生视频、图生图、图生视频等多模态能力的竞争；与此同时，在降本增效的大环境下，企业对“性价比”的要求也会更高。

降低使用门槛、提高平台适配性，就成为了国内大模型产业落地首当其冲的挑战。

吴运声认为，只有进一步降低工具使用门槛，减少对技术人才及专业技术能力依赖，让一线生产、经营人员也能“零门槛”用上大模型，才能加速生产经验与模型技术的融合，用技术为企业解决实际问题。未来，企业生产场景都将建基于AI能力，企业的产品设计、运营流程、管理形式都可能围绕AI重构。企业选择的大模型工具，既要能匹配、适应不断迭代的大模型技术，也需要满足不断扩大的场景需求，满足可持续的投入产出比。

吴运声补充道，生成式AI具有强大的归纳、生成、推理能力，但也面临全新的安全挑战。只有保障生成结果的安全、准确，才能满足企业对稳定性的需求，让企业管理者放心加大投入建设——为了更好地解决这些需求，腾讯云发布了三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”。

例如，在过去的客服等知识服务场景中，大模型应用往往受制于复杂文档解析难、复杂任务规划难，以及专属行业适配度不高。腾讯最新推出的大模型知识引擎，集成了腾讯混元大模型和行业大模型的优势，用户只需要输入模型选择、角色设定、知识库管理等基本信息，“三步5分钟”就可以搭建出一款知识应用，使用门槛大大降低。

从问答效果来看，知识引擎以RAG（检索增强生成）技术架构为基础，整合了OCR文档解析、向量检索、大语言模型、多模态大模型等多项技术。用户上载专属知识库与行业专业文档后，模型会先通过向量数据库，生成大量问答。当用户提问时，系统先匹配相关文档片段，再由大模型基于提取内容来推理，这样会生成准确率远超通用大模型的回答。此外，知识引擎还支持图文混排、说明书、数据图标等复杂文档识别解析，大大提高用户体验。

此外，针对图像、视频素材等生成场景，腾讯推出了“图像创作引擎”、“视频创作引擎”两款大模型PaaS工具。图像创作引擎，基于腾讯混元的自研图像创作底层模型，具备领先的文生图、图生图能力，为企业客户提供AI写真、线稿生图等图像创作能力；“视频创作引擎”，则基于多模态算法技术，实现视频转译、视频风格化、画布拓展等多种功能，助力企业客户快速、高性价比输出各类视频内容，用于不同群体、不同平台的广告投放。

“大模型的打造只是起点，把技术落地到产业场景，创造价值才是目标”。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，腾讯始终以“产业实用”作为发展大模型的核心战略，通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施，以及强安全的模型环境，构建“离产业最近的AI”。

混元大模型部分中文能力已追平GPT-4，腾讯还将推出助手类APP

除了大模型的产业落地，腾讯混元大模型的最新进展，也是当天峰会的一大焦点。

自2023年9月首次亮相以来，腾讯混元大模型不断探索最新技术，已拓展至万亿规模，并在国内率先采用混合专家模型（MoE）结构，这带来了模型总体性能的升级。腾讯集团副总裁蒋杰在峰会上表示，腾讯混元大模型经过持续迭代，目前整体性能居国内第一梯队，部分中文能力追平GPT-4。

此外，腾讯还研发了1B、3B、7B、13B等不同参数量下的Dense和MoE模型，围绕中小型模型进行了积极部署。资料显示，混元大模型提供万亿参数hunyuan-pro、千亿参数hunyuan-standard以及百亿参数的hunyuan-lite等多种尺寸的模型服务，其中hunyuan-standard模型具备256k的超长上下文理解能力，单次处理字符数超过38万个。

观察者网摄

在多模态能力方面，混元大模型进展颇多。大会透露，在图片生成领域，腾讯混元文生图基础架构已全面升级至sora同款的DiT架构，支持中英文双语输入及理解，具备多轮绘图能力，测评结果国内领先；在视频生成领域，腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力，视频生成长度可达16秒；在生3D层面，腾讯混元已布局文/图生3D，单图仅需30秒即可生成3D模型。

在大会上，蒋杰宣布腾讯混元大模型将坚定拥抱开源，为技术社区生态繁荣贡献力量。据了解，目前，腾讯混元文生图大模型已全面开源，开源3天内就在Github上获得超千位开发者关注。未来，多种尺寸的腾讯混元MoE模型也将对外开源，可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

值得补充的是，在当天的峰会现场，腾讯还官宣了几则与产品“上新”有关的消息。

蒋杰宣布，腾讯混元将上线一站式AI智能体创作与分发平台“腾讯元器”，开启智能体生态。在平台上，用户不仅可以在创建专属AI智能体，使用腾讯官方的插件和知识库，还能将这些智能体一键分发到QQ、微信客服、腾讯云上；此外，为更好地为用户提供服务，基于混元大模型打造的C端助手App“腾讯元宝”，也将于5月30号发布。

		自动登录	找回密码
密码			立即注册

60%中国企业想用生成式AI，障碍在哪？

相关帖子