|
org.apache.solr.common.util.ContentStream.java 主要是获取文件,URL,字节数组,字符串等的数据流.主要方法又InputStream getStream()和 Reader getReader().
其实现类:org.apache.solr.common.util.ContentStreamBase.java为抽象类.以下有URLStream.java,FileStream.java,StringStream.java,ByteArrayStream.java四个实现类.分别针对URL,文件,字符串,字节数组.
接口:ContentStream.java
package org.apache.solr.common.util;
import java.io.IOException;
import java.io.InputStream;
import java.io.Reader;
/**
*
* @since solr 1.2
*/
public interface ContentStream {
String getName();
String getSourceInfo();
String getContentType();
/**
* @return 数据流大小 或者 null
*/
Long getSize(); //如果知道返回大小否则位null
/**
* 获取一个打开的数据流,那么必须负责关闭它.可以考虑这样使用:
*
* InputStream stream = stream.getStream();
* try {
* // use the stream...
* }
* finally {
* IOUtils.closeQuietly(stream);
* }
*
*
* 为了保证正在运行,只有在第一次时调用getStream() 或者 getReader(),
* 其他调用的运行行为时不明确的.
*
* 注意: 在属性(name, contentType, etc)保证被赋值之前,必须调用getStream() 或者
* getReader().数据流只有在该方法调用时才可能懒加载.
*/
InputStream getStream() throws IOException;
/**
* 获取一个打开的数据流,那么必须负责关闭它.可以考虑这样使用:
*
* Reader reader = stream.getReader();
* try {
* // use the reader...
* }
* finally {
* IOUtils.closeQuietly(reader);
* }
*
*
* 为了保证正在运行,只有在第一次时调用getStream() 或者 getReader(),
* 其他调用的运行行为时不明确的.
*
* 注意: 在属性(name, contentType, etc)保证被赋值之前,必须调用getStream() 或者
* getReader().数据流只有在该方法调用时才可能懒加载.
*/
Reader getReader() throws IOException;
}
View Code 抽象类:ContentStreamBase.java 及其实现类URLStream.java,FileStream.java,StringStream.java,ByteArrayStream.java
package org.apache.solr.common.util;
import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;
import java.io.StringReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.Locale;
/**
* 三个ContentStream的具体实现 - 一个 File/URL/String
*
*
* @since solr 1.2
*/
public abstract class ContentStreamBase implements ContentStream
{
public static final String DEFAULT_CHARSET = "utf-8";
protected String name;
protected String sourceInfo;
protected String contentType;
protected Long size;
//---------------------------------------------------------------------
//---------------------------------------------------------------------
/**
* 从 内容类型字符串中得到字符编码设置,没有的话,返回null
* @param contentType
* @return
*/
public static String getCharsetFromContentType( String contentType )
{
if( contentType != null ) {
//获取contentType中"charset="的索引下标
int idx = contentType.toLowerCase(Locale.ROOT).indexOf( "charset=" );
if( idx > 0 ) {
return contentType.substring( idx + "charset=".length() ).trim();
}
}
return null;
}
//------------------------------------------------------------------------
//------------------------------------------------------------------------
/**
* 根据URL 构造ContentStream
*
* 这里使用URLConnection来获得数据流的内容
* @see URLConnection
*/
public static class URLStream extends ContentStreamBase
{
private final URL url;
public URLStream( URL url ) {
this.url = url;
sourceInfo = "url";
}
@Override
public InputStream getStream() throws IOException {
URLConnection conn = this.url.openConnection();
contentType = conn.getContentType();
name = url.toExternalForm();
size = new Long( conn.getContentLength() );
return conn.getInputStream();
}
}
/**
* 根据File 构造ContentStream
*/
public static class FileStream extends ContentStreamBase
{
private final File file;
public FileStream( File f ) {
file = f;
contentType = null; // ??
name = file.getName();
size = file.length();
sourceInfo = file.toURI().toString();
}
@Override
public String getContentType() {
if(contentType==null) {
InputStream stream = null;
try {
stream = new FileInputStream(file);
char first = (char)stream.read();
if(first == ' |
|
|