Apache Tika 0.6 released
这个Tika是Lucene的子项目,主要用来从各种文档中如doc,pdf,zip,odt等文件中抽取中元数据和结构化文本数据,这样Lucene可以搜索各种文档。依赖的项目有poi(读取doc)、pdfbox(读取pdf)、commons-compress(解压压缩文件,这样方便操作odt)等其他格式。
Release Audit Tool
这个项目我是在google Summer of Code中看到的,现在Apache 孵化器中。主要用来检查Apache旗下的项目中代码的重复或者里面有没有不符合APL协议内容的代码,以保证代码纯正度,使Apache的商业用户避免版权的风险。像IBM等大量使用开源的公司都有一套比较完善的机制防止其他的代码污染自己的商业产品。目前这个没有下载,只有从SVN中自己下载和构建,这个是要简单看一下主页上的说明就可以了。官方地址 http://incubator.apache.org/rat/
Apache OpenJPA 2.0.0-beta released
Apache 的JPA实现。除其他JPA实现,如Hibernate的另外一个选择。
Jackrabbit 2.0.0 released
这个以前介绍过,是JCR的实现。 2.0算是一个真正成熟的产品了。