中文 English
您好!半岛体育官方入口
产品中心

模具氮气弹簧

PRODUCT

产品中心

联系我们

    移动电话:13620045661、13602381201刘工

    电话:0769-85309665  传真:85322966
    QQ:1048038402、1559436599
    电邮:bbk100@126.com
    地址:广东省东莞市长安镇沙头358省道998号港芝科技园
模具氮气弹簧

旷视科技发布全新轻量级 LLM 模型推理框架 InferLLM助力大模型实现落地

来源:半岛体育官方入口    发布时间:2023-09-24 23:50:36

  ChatGPT的火爆出圈让大家看到了大型语言模型的潜力,多家公司开始自研大型语言模型,开源社区也已然浮现了非常多优秀的模型。旷视科技也发布了全新轻量级 LLM 模型推理框架 InferLLM,助力大模型实现落地。虽然大型语言模型在文案生成、内容创作、代码编程等方面展现了强大能力,但其海量的参数和巨大的模型体积,让大语言模型在边缘端设备上运行仍面临许多挑战。为加速大语言模型落地应用,旷视天元开发了 InferLLM 工程,提供一个比 llama.cpp 更简单更容易上手的本地部署框架,让大语言模型在本地或者端上部署成为可能。 旷视天元开源深度学习框架MegEngine是旷视科技自主研发的国产工业级深度学习框架,是旷视科技新一代AI生产力平台Brain++的最核心组件,在2020年3月正式向全球开发者开源。

  旷视科技天元凭借其训练推理一体、超低硬件门槛和全平台高效推理3大核心优势,可以帮助企业与开发者大幅节省产品从实验室原型到工业部署的流程,真正的完成小时级的转化能力。旷视天元一直在优化,推出了一系列实用功能,降低 AI 算法生产门槛,助力 AI 应用快速落地,这中间还包括:引入动态图显存优化(DTR)技术,大幅度减少显存占用,节省开发者硬件成本,用有限硬件资源训练出更大模型;开源面向计算机视觉应用的流式计算框架MegFlow,开发者基于MegFlow 提供的视觉解析服务方案,最快 15 分钟就可以完成客制化所需功能,AI 应用落地不再难;开发出创新性的TracedModule 方案以及 MegEngine Lite,基于旷视科技海量业务打磨出的模型推理最佳实践,化解模型转换部署难题……

  除了开源深度学习框架旷视天元外,旷视科技的科研成果包括AI生产力平台Brain++、AI算法生产平台AI Service、移动端高效卷积神经网络ShuffleNet等多项创新技术和产品。目前,旷视已在ICCV、CVPR、ECCV 等国际学术会议、期刊上发表论文200余篇,在各项国际人工智能顶级竞赛中累计揽获 56 项世界冠军或最高荣誉。

  当下,大模型已成为 AI 重要的技术发展趋势。旷视科技一直坚定投入大模型研发,具备领先的大模型原创科研能力。面向未来,旷视科技将积极拥抱多模态大模型,同时将大模型与硬件结合,面向物联网场景打造不一样的行业应用。

立即联系