

关于我

分类
全部三俗杂谈学习生活Chemistry前端开发分享创造年终总结尘世家宴人工智能

标签
随想
AI
人工智能
感情
思考人生
严肃讨论
生活
DeepSeek
Cursor
工具类
关系论
前端
化学
年终总结
美食
CloseAI
Minecraft
插件
Nukkit
Bukkit
Java
渣男
偏见
缓存
宽带
宽带症候群
小程序
Taro
React
瞎鸡拜折腾
净水器
厨房
GFW
墙
傻逼
耍猴
WP
WordPress
微博
学术
工作
异地恋
Windows
输入法
闲的蛋疼
创造
软件
爱国
愤青
爱国主义
FydeOS
uTools
家宴
厨艺
博客
重构
技术
FydeOS AI
机器学习
Copilot
友情链接
关于 DeepSeek NSA 论文的一点思考
2025-02-19 01:09:00
今天看到 DeepSeek 团队前几日发布的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Att...
关于 DeepSeek-R1 与 CoT 模型的提示词策略一点记录
2025-02-11 02:23:00
今天在公司和同事们开会,讨论到了 CoT(Chain of Thought)模型 和 通用模型 在提示词策略方面的差异,尤其是与 DeepSeek-R1 的训练过程有关的内容。此话题让我想起了之前阅读...
DeepSeek V3 与 AI 训练新思路:低成本硬件与技术突破
2025-02-09 01:29:00
今天在站会上和同事讨论了从一个 AI 应用团队(即 AI 的使用者)向 AI 全链路团队(即从模型训练到应用全程都参与)转型的可能性。这让我联想到了最近看到的一篇关于 DeepSeek V3 技术的访...