关于我
分类
全部
三俗杂谈
学习生活
Chemistry
前端开发
分享创造
年终总结
尘世家宴
人工智能
标签
随想
AI
感情
人工智能
思考人生
生活
严肃讨论
DeepSeek
工具类
前端
化学
年终总结
美食
CloseAI
Minecraft
插件
Nukkit
Bukkit
Java
渣男
关系论
偏见
缓存
宽带
宽带症候群
小程序
Taro
React
瞎鸡拜折腾
净水器
厨房
GFW
墙
傻逼
耍猴
WP
WordPress
微博
学术
工作
异地恋
Windows
输入法
闲的蛋疼
创造
软件
爱国
愤青
爱国主义
FydeOS
uTools
家宴
厨艺
博客
重构
技术
FydeOS AI
机器学习
友情链接
关于 DeepSeek NSA 论文的一点思考
2025-02-19 01:09:00
今天看到 DeepSeek 团队前几日发布的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Att...
关于 DeepSeek-R1 与 CoT 模型的提示词策略一点记录
2025-02-11 02:23:00
今天在公司和同事们开会,讨论到了 CoT(Chain of Thought)模型 和 通用模型 在提示词策略方面的差异,尤其是与 DeepSeek-R1 的训练过程有关的内容。此话题让我想起了之前阅读...
DeepSeek V3 与 AI 训练新思路:低成本硬件与技术突破
2025-02-09 01:29:00
今天在站会上和同事讨论了从一个 AI 应用团队(即 AI 的使用者)向 AI 全链路团队(即从模型训练到应用全程都参与)转型的可能性。这让我联想到了最近看到的一篇关于 DeepSeek V3 技术的访...