2026
01-13
01-13
DeepSeek发布梁文锋署名新论文 V4有望支持全新记忆架构 NEW
快科技1月13日消息,今日,DeepSeek发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。DeepSeek发布梁文锋署名新论文 V4有望支持全新记忆架构论文提出条件记忆(conditional memory)...
Read More >
快科技3月24日消息,香港中文大学(深圳)公共政策学院院长郑永年近日接受采访时表示,随着中国转向技术原创,美西方的打压限制事实上为时已晚。“未来西方甚至可能在一些原创技术上依附于中国。美国和欧洲的资本对中国依然越来越感兴趣。这不仅源于中国的庞大市场、超过4亿的中产人群,也与中国稳定的政治环境,以及仍可观的未来增长空间有关。”对于近期爆火的DeepSeek和《哪吒2》,郑永年说,二者都是以先进技术为核心的产品,但其实都只是“冰山一角”,无论是在杭州还是深圳都是如此。从现代化的经...
快科技2月28日消息,在不舍与兴奋中,我们迎来了DeepSeek开源周第五天。今天DeepSeek开源的项目是:Fire-Flyer文件系统,即3FS。DeepSeek完美收官:开源劳苦功高的3FS!据了解,3FS是一个高性能并行文件系统,它是所有Deepseek数据访问的助推器,能应对AI训练和推理工作负载的挑战。它利用现代SSD和RDMA网络提供共享存储层,能简化分布式应用程序的开发,具有以下主要特性:1、分离式架构:结合了数千个SSD和数百个存储节点的网络带宽,使应用程...