DeepSeek再上新台阶,产业影响力持续扩大
DeepSeek的价值正在快速提升,过去短短时间内,发生了几件重要的事情:
DeepSeek-R1入驻国家超算互联网平台,支持高达671B参数的完整版本。
平头哥玄铁芯片成功兼容DeepSeek-R1系列蒸馏模型,为RISC-V架构CPU和边缘计算平台带来了新的应用场景。
加上春节期间三大运营商全面接入DeepSeek的消息,它的影响力已经超越了AI和互联网领域,正向更深层的产业领域渗透。
总而言之,用户和开发者不再需要忍受服务器拥堵的困扰,可以尝试在更多平台使用DeepSeek。
随着官方服务器压力增大,以及DeepSeek-V3 API优惠活动结束,各大云服务商纷纷抓住机会展开竞争。
云服务商的价格战,新芯片的速度比拼
腾讯云率先推出了支持联网搜索的DeepSeek服务,结合搜狗搜索提供增强API。
同时,它还支持集成私域知识库,方便用户一键整合RAG。
商汤科技和阿里云则直接打响了价格战。
商汤大装置平台在3个月内提供1000万tokens的限时免费使用,并支持128K的最大上下文长度。
阿里云为新用户提供100万免费tokens,并且蒸馏版模型的价格也相对较低。
与此同时,各类芯片厂商也在推理速度上展开激烈的竞争。
在通用GPU方面,AMD员工透露,MI300X上运行的DeepSeek-R1完整版的速度比发布之初提升了3倍,并发布了官方Docker Image镜像。
这为英伟达及其CUDA生态之外的用户,提供了AMD与ROCm的替代选择。
Groq、Cerebras和Sambanova这三家新兴AI推理芯片公司,已经将DeepSeek-R1-Distill Llama-70B的推理速度提升到了每秒500-1500个tokens。
速度之快,以至于你可能还没反应过来,推理思维链就完成了,代码也写好了,眨眼间就可以直接运行了。
△groq芯片运行DeepSeek-R1-Distill Llama-70B
额外发现
另外还有一个有趣的消息,ai.com域名现在已经重定向到DeepSeek的官方网站。
甚至有传言称,DeepSeek花费巨资收购了该域名。
但长期关注大模型领域的朋友可能还记得,这个域名之前曾先后指向ChatGPT和xAI。
因此,更可能是域名持有者的个人行为~
目前由于访问人数较多导致DeepSeek服务器超负荷,大家可以从另外2个渠道去使用,不会卡:
渠道一:硅基流动(SiliconFlow):AI人工智能云服务平台
DeepSeek官网下载: 【点击登录】