|
[size=large]
<?php
/**
*
* @author
* @version $Id$
*/
// 这个php文件用到了大多数数据处理需要用的功能。
#error_reporting("ALL");
#
$db = tdbm_popen("./id.words.tdbm", O_RDONLY, 0444, 0, 0);
function getTitle($db,$id)
{
$relate = tdbm_fetch($db,$id);
return $relate;
}
# 读取文件
$file_handle = fopen("./new.fix", "r");
$count =0;
# 遍历文本文件中的行
while (!feof($file_handle))
{
$line = fgets($file_handle);
#if($count >40)
# return ;
#echo
$line = preg_replace("/\\n/","",$line);
#echo $line;
$arr = explode("",$line);
if (count($arr)<2)
continue;
$query=$arr[0];
$ids=$arr[1];
$arrID = explode("",$ids);
$len=count($arrID);
$str="";
unset($hash);
for ($i=0; $i<$len; $i++)
{
$title=getTitle($db,$arrID[$i]);
$words = explode("",$title);
foreach($words as $word)
{
//echo $word;
//判断是不是在hash词典中
if( isset($hash[$word]))
{
$hash[$word] = $hash[$word]+1;
}
else
{
$hash[$word] =1 ;
}
}
}
$i=0;
//遍历hash数据结构
foreach ($hash as $key=>$val)
{
if( $i ==0)
{
$str=$key."\x03".$val;
$i =1;
}
else
{
$str = $str."\x02".$key."\x03".$val;
}
}
//字符串拼接
echo "qf".$query."\x01".$str."\n";
}
fclose($file_handle);
?>
|
|
|