2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。
DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000GB/s的内存带宽以及580TFLOPS的计算性能。”DeepSeek表示。
据介绍,MLA是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能?。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构?。
此前2月21日午间,DeepSeek在社交平台宣布,将连续开源5个项目的代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,这一计划定义为“Open Source Week”。DeepSeek表示,其在线服务中的构建模块已经被记录、部署并进行了实际测试,希望分享的每一行代码能加速行业发展进程。就在DeepSeek加码开源的同时,包括上海交通大学、深圳大学、浙江大学在内的多所高校本月都宣布开设DeepSeek课程。
民生证券计算机团队23日撰文指出,DeepSeek开源给予了云厂商低门槛部署世界级AI大模型机遇,而客户对于数据合规与部署便捷性需求,催生出DeepSeek一体机的蓝海市场。
已有超30家企业推出一体机
据民生证券计算团队梳理,天玑科技、深信服、海康威视、大华股份、浪潮信息、中国长城等30多家企业均推出了大模型一体机,其中以“DeepSeek”命名的约有近20家。
云从科技在接受南财快讯记者以投资者身份采访时表示,政务方面的一体机存在本地化部署的需求,但是客户订单信息无法透露。谈及账期是否较长时,该人员称,得看具体的约定,这与签订的合同有关。
浙商证券指出,一体机“开箱即用”,是便捷、低门槛的私有化部署方案。还能够降低算力使用门槛,对于对数据安全要求较高的央国企、党政机关,一体机可以为其提供可靠省心的解决方案。
据了解,一体机是专为人工智能大模型应用和部署而设计的集成计算设备,本质上可以看作是AI服务器与大模型私有化部署的融合,通常包含中央处理器、图形处理器(GPU)、存储器、操作系统、AI平台软件及各类模型算法等软硬组件。
根据浙商证券测算,预期DeepSeek快速部署需求有望带动一体机需求增长,2025年到2027年一体机需求量将分别将达到15、39、72万台,对应市场空间1236、2937、5208亿元。
2月24日,DeepSeek一体机概念发生异动,云从科技-UW盘中一度涨停,软通动力、科大讯飞、拓维信息等多股盘中走高,截至收盘均有回调。
本文综合自21财经客户端、南财快讯、上海证券报、证券时报、每日经济新闻
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
劈竹切削、弯折固定、蒙布上色……历经160多道复杂的工序,一条栩栩如生的布龙扎制完成。 临...
近日,恒生聚源旗下新一代智能投研平台WarrenQ已全面接入DeepSeek大模型,迈入金融...
下周,28家上市公司迎来限售股解禁,对应市值合计227.37亿元。 节后氯化钾价格飙升 ...
在科技浪潮汹涌澎湃的当下,人工智能领域又一盛事——全球开发者先锋大会正在举办。本次大会聚焦前...
2月22日,全国首个甘蔗智慧农场在广西崇左市江州区罗白乡益兴糖料蔗基地建成。 据悉,崇左作...
2月21日,AI基建方向领涨A股市场,云计算、数据中心、液冷服务器等细分方向集体爆发。 资...
岁末年初,“中华商业第一街”南京路步行街将再次披上跨年节庆盛装,迎来2025年“南京路和你一...
蛇年至今两周有余,AI行情淋漓尽致,从DS到云计算,从大数据到AI+,翻番个股不在少数,中国...