研究 & 写作

关于 SEC 数据、AI Agent 与金融基础设施的手记。

每周长文,写我们看到的、修过的、正在搭建的。从我们的 Substack 镜像同步。

1,247 位订阅者 · 每周 · 免费

或关注: [Twitter] · [RSS] · [Substack]

01 / 最新

数据质量 ·12 分钟阅读 ·2026-05-23

为什么各家 SEC API 都把 CRWD 营收算错了(包括我们,直到上周)

CrowdStrike 的营收字段在过去 8 个季度里,在每一家主流 SEC API 里都是 0——包括 KO。原因藏在 XBRL concept 映射里,修复花了 200 行 patch。这篇讲清楚这个 bug 为什么到处都在、为什么上游 SEC API 至今没修。

#data-quality#xbrl#bugs
在 Substack 阅读

02 / 浏览

数据质量·12 分钟·05-23

为什么各家 SEC API 都把 CRWD 营收算错了

CrowdStrike 的营收挂在一个 SEC 官方字段映射会跳过的非标准 XBRL concept 上。我们追踪了三家商业 API 的同一个 bug,并交付了现在用在 marts.fact_financials_quarterly 的 200 行修复。

#xbrl#bugs
阅读
数据质量·9 分钟·05-16

先锋的 13F 修正如何搞坏所有报表工具

先锋为每个份额类各提交一份 13F-HR 修正,我们测过的每个工具都重复计数。修复只是一个按 accession 取 MAX 的窗口函数。这篇给出 SQL,以及对已披露 AUM 的校验。

#13f#bugs
阅读
数据质量·7 分钟·05-09

没人提的 13F LAG 窗口 bug

用一个朴素的 LAG() 分区计算持仓环比,会悄悄毁掉每只基金的首次出现。我们给出复现、解释为什么每个类 Postgres 管道都会错,以及 affected-keys 重算模式。

#13f#sql
阅读
行业·6 分钟·05-02

佩洛西上季度到底交易了什么(不是 Stocktwits 说的那样)

热门信息流把 45 天前的 PTR 当突发新闻转发。我们拉取众议院书记官的原始 PDF,对配偶申报做对账,给出真实的持仓级变化——包括两笔别人都没注意到的。

#congress#analysis
阅读
RECIPE·11 分钟·04-25

财报超预期前 6 个月的内部人买入规律

一个可复现的回测,把 Form 4 买入与随后的财报意外跨 2014–2025 拼接。30 天内 3 名以上内部人集中买入,有 63% 的概率领先一次超预期。完整 SQL、完整数据、无付费墙。

#insider#backtest
阅读
行业·8 分钟·04-18

Form 144——SEC API 供应商漏掉的提前信号

Form 144 在卖出发生之前就申报。多数数据商跳过它,因为文件格式极其难看。我们解析了 2010 年以来全部 200 万份申报,展示这个 30 天「拟卖出」窗口如何预测了近五次科技抛售中的三次。

#form144#insider
阅读
RECIPE·10 分钟·04-11

FTD 热力图:哪些股票有 30+ 天的交割失败

持续的 FTD 是波动事件的已知前兆。我们用 SEC 双周一次的交割失败数据搭一张日度热力图,挑出 50 个慢性违约标的,并与 RegSHO 强平清单交叉核对。

#ftd#short
阅读
行业·7 分钟·04-04

RegSHO 强平清单:一个免费的风险指标

三家 SRO 每天发布逼近强制买入的证券清单。合起来就是最干净的免费逼空风险信号之一。这篇讲我们如何把 NASDAQ、NYSE 与 FINRA OTC 合并成一条归一化数据流。

#regsho#short
阅读
工程·15 分钟·03-21

为什么我做的是 SEC MCP,而不是又一个仪表盘

别家 SEC 数据产品都先做一个 UI,JSON 端点是事后补的。我认为 AI Agent 才是新的 UI,JSON 端点才是产品本身。这篇讲契约设计、19 个工具,以及我会怎么重做一遍。

#mcp#design
阅读
← 上一页 1 2 3 12 下一页 →

订阅

新文章,直接进你的收件箱。

每周一篇长文。真实数据、真实修复、真实 recipe。

已有 1,247 位读者 · 无垃圾邮件 · 随时退订