您的位置: 首页  > 中国 > 中国软件 > Coreseek
绿色等级: 0 0 0 0 0 (请点击颜色评级)
名称

Coreseek

状态 正常
分类软件Aleax141928 人气2170 评论0
推荐给好友网站报错添加到我的导航 Coreseek首页图片

网站简介

   我来完善

Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索系统。

Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,用户可以免费下载使用;同时针对有实际需要的客户,我们还提供专业的搜索技术与本地化的Sphinx技术支持服务(客户中,记录量最大已超过30亿条,文本容量最大已超过5TB)。我们也提供了QQ群、MSN群,广大用户可以在线及时沟通交流。

Coreseek全文搜索服务器的主要特性包括:

支持多种数据来源
Mysql数据库
支持多种MySQL文本数据的中文编码格式,目前支持的有UTF-8、GB18030;
PostgreSQL数据库
xmlpipe2 数据管道
允许用户通过xmlpip2向全文搜索服务器导入自定义格式的数据。
Python 可编程数据源
高性能
高速索引
在现代CPU上可达10 MB/秒(英文),在启用了中文分词后,建立索引的速度可达300K/s;
高速搜索
在2-4 GB的文本建立的索引上搜索,平均0.1秒内获得结果;
可处理大数据量
在单一CPU上,实测最高可对100GB的文本建立索引,单一索引可包括100M文件
支持分布式搜索
支持主从式的分布式搜索,支持单一节点失效不影响整个搜索系统
支持复杂的查询
支持基于短语和基于统计的复合结果排序机制
支持任意数量的文件字段(数值或全文文本)
支持不同的搜索模式( “完全匹配” , “短语匹配”和“任一匹配” )
为中文优化
基于最大匹配算法的中文分词模块
支持GB18030、UTF-8等多种编码的数据源
针对中文的具体特点,对结果的排序进行了优化

联系方式:
公司:北京选择软件科技有限公司
地址:北京市海淀区中关村东路18号财智国际大厦c座1703室
固定电话: +86 (010) 8260 0620
联系人:李沫南(nzinfo)
联系目的:风险投资、战略合作
移动电话: 131 2186 8038
电子邮件:limn (a) coreseek.com
联系人:乔楚(HonestQiao)
联系目的:商务洽谈、项目合作、技术支持、技术咨询
移动电话: 135 8188 2013
电子邮件:honestqiao (at) coreseek.com
联系人:何骞(He Qian)
联系目的:移动互联网业务
电子邮件:coreseek (at) heqian.name
MSN: heqian (at) hotmail.com

上一个:金达 下一个:comodo
分享到:

发表评论

进入网站|回到顶部
"优秀网站大全"温馨提醒:
1、请勿发表违反国家法律评论,评论请文明用语;
2、禁止发布广告评论。
匿名发表    验证码:

本类网站排行

  • 评论
  • 人气

网站轮播

商城轮播

关于我们 | 联系我们 | 贡献网站 | 免责声明 | 友情链接 | 意见反馈 | 网站地图 |网站帮助| 返回顶部

湘公网安备 43052102000164号