RDKit 与 PostgreSQL 指纹检索笔记

RDKit 与 PostgreSQL 的组合很适合把化学信息学能力沉到平台底层，但真正难的部分往往不是函数调用，而是数据生命周期。

需要提前决定的事情

分子数据表不是静态表，它更像一个可审计的物化视图集合。结构清洗、盐拆分、tautomer 处理、fingerprint 计算都应该有版本号。

select compound_id, standardizer_version, fingerprint_version
from compound_features
where project_id = 1
order by updated_at desc;

版本字段看起来不起眼，但它让模型结果、实验记录和后续回放都有了共同语言。