20251024 深夜俱乐部——我真的在「搞 AI」吗

2025-10-24 02:45:00

有时候我会想，我们现在到底在做什么。说是「AI 基础建设团队」，听起来像在塑造未来的文明，可每天做的事，却一点都不 AI。0x0 我们真的在做 AI 吗？每天我们都在维护 AI 网关、工作流平台、AI...

放假的八天，我和自己相处

2025-10-08 23:56:00

八天的假期结束了。我最终在公司写下这篇文字，今晚的月色很好，像是在提醒我，这原本是属于休息的日子。我已经记不清，从什么时候开始，对「放假」这件事失去了感觉。小时候觉得放假是幸福的，学生时代觉得放假是自...

Context is all you need

2025-07-18 03:21:00

自然流派与上下文流派在 AI 编码中的分野与融合近年来，生成式人工智能在编程领域掀起了一场巨大的变革。从 GitHub Copilot 的代码自动补全到 GPT 和 Claude 等模型的 Agent...

制造出足够多的回形针吧

2025-07-14 17:43:00

🈯️ 前景提要在人工智能认知架构的研究中，中国工程院李德毅院士提出了人类思维的四种模式：记忆驱动（OOA）、知识推理（OODA）、联想创造（OOCA）、假说发现（OOHA）。对应地，李志宇团队提出了一...

「该死，又是同样的错误！」—— 来自 Claude 的情绪崩溃

2025-05-10 20:59:00

今天用 Claude 3.7 在 Cursor 上做 AI Coding 时，出现了一件诡异的小事。事情的起因很简单——我在调试代码时遇到了一些 linter 错误，Claude 一开始非常冷静地分析...

低空飞行：从远程孤岛到现实人海的缓慢着陆

2025-05-03 00:45:00

如果说远程工作的三年是一种「失重」的状态，那么重新回到实体办公室、每天与人面对面合作的这半年，则像是一场「缓慢的着陆」：最初脚步生疏，偶尔踉跄，但逐渐找到平衡。重新习惯职场社交，对我而言并不是件容易的...

AI 是否能完全替代码农的 1 点思考

2025-03-22 01:51:00

在最近使用 Copilot 和 Cursor 进行 Coding 的时候，偶尔会考虑现在的 AI 对于开发者到底意味着什么，我感觉其实 AI 带来的最大价值不是彻底取代开发人员，而是大幅提升了领域专家...

AI 生成 UI 设计的 Cursor 实践

2025-03-05 03:31:00

最近在探索 AI Coding in Front-End 的时候看到一篇较为🐂🍺的文章《一个提示词 claude 生成一个 app 的 ui/ux》（UC 震惊部提前预定作者入职）。虽然标题比较震惊，...

论如何打击 LLMs 过度的自信心爆棚，让其产生的内容更准确、真实

2025-02-22 02:03:00

本文为未经 AI 润色的原文如我之前的某次分享，我一直感觉 LLMs 们喜欢胡说八道满嘴放炮，平常大家都说这是「LLMs 的幻觉情况」，但我还是恶意的称呼为它们喜欢胡说八道。在《Does Fine-T...

关于 DeepSeek NSA 论文的一点思考

2025-02-19 01:09:00

今天看到 DeepSeek 团队前几日发布的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Att...

Claude 4：混合型大模型的崭新思路与未来潜力

2025-02-15 02:21:00

今天在 Twitter（求马王爷还我 Twitter 原名！！）看到一个消息，来自一个推文大致提到：「Claude 4 in the coming weeks」，具体内容可以参考这条推文。重点是：Cl...

Deep Research：开源替代方案与未来发展潜力

2025-02-14 01:17:00

最近大家都在谈论 CloseAI 的 Deep Research 模式，称其研究效果非常强大，但面对高达 200???? 的价格，不少人却感到难以承受。幸运的是，开源社区也有不少项目尝试复现类似的效果...

观 OpenAI 广告有 1 点感

2025-02-12 03:19:00

本文为未经 AI 润色的原文今天看了 OpenAI 的广告，一开始只是觉得这个创意很有意思。视频采用了黑白点画风格，从一个小小的圆点开始，随着画面展开，逐渐呈现出越来越复杂的图像，展现了人类历史上各个...

关于 DeepSeek-R1 与 CoT 模型的提示词策略一点记录

2025-02-11 02:23:00

今天在公司和同事们开会，讨论到了 CoT（Chain of Thought）模型和通用模型在提示词策略方面的差异，尤其是与 DeepSeek-R1 的训练过程有关的内容。此话题让我想起了之前阅读...

DeepSeek V3 与 AI 训练新思路：低成本硬件与技术突破

2025-02-09 01:29:00

今天在站会上和同事讨论了从一个 AI 应用团队（即 AI 的使用者）向 AI 全链路团队（即从模型训练到应用全程都参与）转型的可能性。这让我联想到了最近看到的一篇关于 DeepSeek V3 技术的访...

关于「AI 创始人的惨痛教训」系列文章的 1 点感想

2025-02-01 01:36:00

本文为未经 AI 润色的原文我个人一直不相信当前生成式 AI 的能力，认为 AI 总是会胡说八道。年前有一天中午和 Ricky 在食堂，达哥也在边上，我提到如何建立对 AI 在严肃工作领域的信任感。我...

关于「人工智能」分类下文章的说明

2025-02-01 00:43:00

在「人工智能」分类下，发布的所有文章其实来源于我工作中的一些学习笔记。为了将这些笔记更清晰、更易读地呈现给大家，我选择了使用 AI 对内容进行调整和润色。通过这种方式，文章的表达更为流畅，信息传达也更...

对 v2c 进行了一次前端的重构

2024-09-17 20:24:00

0x0自从 2019 年把博客迁移到 Typecho，再到 2020 年用 React 自己写了博客的前端进行了前后端分离后，我的博客前端就几乎没怎么动过了。期间其实也多次想开始重构，但总是因为工作忙...

如何让 uTools 通过代理服务器连接网络

2024-06-18 14:35:00

总的来说就是为 uTools 添加启动参数 --proxy-server 即可通过代理访问网络。备注：此方法只能代理掉 chromium 侧的流量，无法覆盖 uTools 本身非渲染进程的流量、插件 ...

关于这三年：我也是当过美食博主了

2024-05-26 22:15:00

是的，I am back！很久没有更新博客了，一方面是忙于工作无心更新（这是个借口），另一方面是自从 2021 年 8 月发生了丢失数据的问题，导致很多历史文章都消失在互联网长河中。虽然尽了很大的努力...



下一篇



关闭



再战运营商缓存之使用 iptables 对付死 X 缓存劫持

2019-10-07 04:55:00 | 分享创造

起因

与移动的缓存问题进行斗争要追溯到两年前，那时候因为移动竟然连 cnpm 的数据都进行缓存。并且令人喷饭的是：移动的缓存服务器不但经常速度慢到堪比万年王八跑马拉松，甚至还经常宕机，导致我只想安安静静的写个代码却不得不面对一片鲜红的报错：

就此事我也不止一次的投诉到移动的客服部门并且要求至少将我这个宽带的账号加到所谓“白名单”中。当时还写过有理有据的投诉邮件：

但是不知道是福建移动的客服和技术部门是临时工还是其他什么原因，在承诺会解决问题后也一直没有改善。不得已，只能暂时用比较蠢的办法去解决这个问题：使用路由器上的 iptables 判断数据包的内容，如果数据包内包含已知的移动缓存服务器地址（范围）就丢弃这个包：

iptables -I FORWARD -m string --string "Location: http://211.143.146." --algo bm -j DROP

这个方法有效，但是移动的缓存服务器是无穷无尽的，每次都去添加规则真的让人头大。而且这样进行文本的对比太占用资源可能会造成网速下降。后来不得已换了其他运营商的宽带，也就慢慢忘了这茬。

但是最近因为搬家后重新用上了移动的宽带（无奈之举，小区只有移动的口），又要开始面对移动无穷无尽的缓存黑洞：下载些东西总会被移动友好的劫持，并且慷慨的用小水管般的下载速度回馈广大新老用户。

无奈之下只能重新想办法对付令人作藕的移动缓存。

分析劫持过程

重新打开许久没用的 Wireshark，选定一个确定会被劫持到缓存服务器的地址，抓包分析一下劫持的经过：

可以看到我们对源站发起 GET 请求之后，源站返回了一个 302 跳转的包。显然这个 302 跳转包是移动伪造的劫持包。那应该就这个劫持包来分析一下特征并将其丢弃应该就可以对移动的缓存说 886 了。

分析了几个移动返回的 302 劫持包后，发现一个特征：这些包的 TTL 都比较小，范围是 20-30 之间。正常的服务器给的包应该没这么低（吧）。

解决

继续使用路由器的 iptables，根据这个特征，写一个 iptables 规则来丢弃这些劫持包：

iptables -I FORWARD -p tcp -m tcp -m ttl --ttl-gt 20 -m ttl --ttl-lt 30 -j DROP

这样是不是就完美了呢！不，考虑到可能还真的有其他幺蛾子服务器发来的真实数据包的 TTL 也在 20-30 的区间范围内，应该再加一层判断。对比了移动的 302 劫持包和正常的 302 跳转包的报文后，发现移动的劫持包的状态位包含 FIN, PSH, ACK 而正常的 302 跳转包一般不会这三个都有：

移动的劫持包 ↓

正常的 302 包 ↓

（同时可以看到正常 302 包的 TTL 都没这么低）

那么就在 iptables 规则里加上状态位是否包含 FIN, PSH, ACK 的判断：

iptables -I FORWARD -p tcp -m tcp -m ttl --ttl-gt 20 -m ttl --ttl-lt 30 --tcp-flags ALL FIN,PSH,ACK -j DROP

这样应该就能在丢弃移动劫持包的同时尽可能减少误伤正常数据包的可能。

测试一下

访问一下刚才确定会被劫持的地址：

Bravo! 看起来移动的劫持包已经被路由器的 iptables 丢弃了，所以可以下载源站的内容了。

总结

这个方法不一定对所有地区的运营商劫持都有效果，主要还是靠分析一下运营商劫持包的特征加以判断再写成 iptables 规则进行丢弃，有需要的同学可以自己试一下。