首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包

搜索引擎技术 [加入]

探讨搜索引擎技术和应用,申请加入请注明身份。
  • 最新:15 篇 共1 页 
  • 1
 

文件区加了北大李晓明的图书《搜索引擎--原理、技术与系统》

目前出版的图书也就这本可以作为入门教材,供各位参考。http://disk.csdn.net/group/SearchTech/大家有什么好的东东奉献出来一起学习学习哦。

作者: zdg    发表时间:2006-12-25 00:09:43   回复数:13   最后更新时间:2008-05-14 09:41:42 最后回复人:liudong1105  

集中/分布式搜索引擎的4种设计方案

对于搜索引擎,   在索引量和搜索量大到一定程度的时候,   索引更新的效率会逐渐降低,   服务器的压力逐渐升高,   因此基本上整个搜索引擎的利用率可以说是越来越低了,   并且随着海量数据存储带来的困难,   设计一个...

作者: zdg    发表时间:2006-12-11 13:48:35   回复数:1   最后更新时间:2008-04-02 10:37:42 最后回复人:xuliugen  

怎样对英文进行分词

如果待分词的文章中的内容是   中英文混合的,那么该怎样才能把英文正确分词呢?请帮忙,最好有代码示例,谢谢

作者: l8693946    发表时间:2007-12-13 13:37:28   回复数:5   最后更新时间:2008-03-06 09:26:45 最后回复人:shideba  

实用的Lucene技术文档!良好的信息检索资料!

Lucene技术文档:http://bl

作者: tornadowp    发表时间:2008-02-29 18:17:40   回复数:0   最后更新时间:2008-02-29 18:17:40

视频网页点击数、评论数、发布日期、简介等特征提取

最近需要对网页上一些特征进行提取,如:视频网页点击数、评论数、发布日期、简介等特征提取。以前是对各个网站写正则模板,来取得这些信息的,但是视频网站数量大,各个子域名的特征又不一样,而且某些网站总是变化...

作者: chentao_666    发表时间:2007-11-19 12:20:58   回复数:3   最后更新时间:2008-02-18 14:34:22 最后回复人:chentao_666  

发一个搞搜索的公司的面试题,请各位回答一下

怎么实现一个数据库连接池?有那些输入输出?ftp服务器的输入输出是什么?如何抓取一个网站的所有页面?比如抓取 <a   href="http://www.sina

作者: gby630    发表时间:2007-08-16 09:39:01   回复数:4   最后更新时间:2008-01-29 13:58:29 最后回复人:yy8354  

[资源]:代码参考   http://gforge.osdn.net.cn/

大家好:   不知道大家知道这个网站不?如果没有进去看看。&nb

作者: JeanLoveLengxue    发表时间:2007-11-22 19:43:53   回复数:4   最后更新时间:2008-01-15 20:07:26 最后回复人:zdg  

[疑惑:]   为什么这个组看起来很冷清,   可是却在人气榜第5?

不知道这个组的owner是否真的要办这个组?

作者: JeanLoveLengxue    发表时间:2007-10-24 12:45:42   回复数:5   最后更新时间:2007-12-21 11:31:13 最后回复人:shmilytea  

急!!!谁了解艾瑞的iAdTracker软件

急!!!谁了解艾瑞的iAdTracker软件

作者: liu_shuo    发表时间:2007-12-12 09:51:02   回复数:1   最后更新时间:2007-12-21 11:30:57 最后回复人:shmilytea  

想系统地学习搜索引擎技术

请问有什么好书,和网站吗,初学者.谢谢

作者: heixia108    发表时间:2007-04-30 23:23:36   回复数:1   最后更新时间:2007-11-16 10:23:19 最后回复人:wqf363  

关于如何建立索引文件

我们平时讨论最多的可能都是一些相关算法的问题   这边所要提出的是,如何建立一索引文件,如何存储,   这次安装了百

作者: web2f    发表时间:2007-07-19 20:45:16   回复数:1   最后更新时间:2007-11-16 10:20:43 最后回复人:wqf363  

推荐一篇文章介绍HTML内容萃取

赖勇浩翻译的   &quot;从HTML文件中抽取正文的简单方案&quot; <a   href="http://blog.csdn.net/lanphaday/archive/2007/08/13/17411...

作者: zdg    发表时间:2007-08-15 19:33:18   回复数:2   最后更新时间:2007-09-21 09:25:52 最后回复人:xsc2001  

IBM   OmniFind   Yahoo!   Edition

IBM联合YAHOO推出针对企业的企业搜索软件----I

作者: lixiaobai    发表时间:2007-02-11 18:26:57   回复数:0   最后更新时间:2007-02-11 18:26:57

本小组成员介绍

accesine960田春峰供职于搜房网,潜心研究搜索技术多年。Blog地址:http://blog.csdn.net/accesine960/anotherleeo李育炜原GlobeHR技术骨

作者: zdg    发表时间:2006-12-18 19:11:57   回复数:0   最后更新时间:2006-12-18 19:11:57

Search   2.0   -   What "s   Next?  

You   may   feel   relatively   satisfied   with   the   current   search   offerings   of   Google,   Yahoo,   Ask   and   MSN.   S...

作者: zdg    发表时间:2006-12-18 11:14:44   回复数:0   最后更新时间:2006-12-18 11:14:44
  • 最新:15 篇 共1 页 
  • 1
 

Cache Time: 2008-05-17 07:39:51Z

网站简介|广告服务|VIP资费标准|银行汇款帐号|网站地图|帮助|联系方式|诚聘英才|English|版权声明|问题报告
世纪乐知(北京)网络技术有限公司 版权所有, 京 ICP 证 020026 号
北京创新乐知广告有限公司 提供技术支持
Copyright © 2000-2007, CSDN.NET, All Rights Reserved
GongshangLogo