Useful Libraries
最近邻搜索 Nearest Neighbor Search
- ANN 实现了最近邻与近似最近邻搜索的基本数据结构和算法。
概率图模型 Probabilistic Graphical Model
- Mixture of Probabilistic PCA
- Belief Propagation
自然语言处理相关 NLP-related
- stemmer: PorterStemmer
- OpenNLP
- GATE
- LingPipe,有书有 tutorial,也有免费版。
- Stanford Parser,基于统计学习的 NLP 工具
常用数据结构 Common Data Structure
- PBDS: trie、tree、hash table 和 priority queue 的 GNU 实现
- boost.pending 中包括一个 Fibonacci heap 的实现
- boost.bgl 是常用 graph 的数据结构和算法的实现
可视化工具 Visualization
- processing + wordcram: 可以用于可视化 words
- gephi: 可视化图
数据 Data
- dbpedia:关于 wikipedia 的数据
- Stanford 3D scanning library:一些物体的 3D 数据,可用于 3D 建模
渲染工具 Rendering
- pbrt
- 1