欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年中文搜索引擎的十大误区搜索研究教程.docx

    • 资源ID:63203030       资源大小:12.72KB        全文页数:4页
    • 资源格式: DOCX        下载积分:9.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年中文搜索引擎的十大误区搜索研究教程.docx

    2022年中文搜索引擎的十大误区搜索研究教程误区1、网站书目就是搜寻引擎 网站书目通常是经过人工分类的有系统的网站列表,通常附带有搜寻功能。网站书目就是搜寻引擎的名词始于雅虎,雅虎初创时就是只有一个网站书目。当然很快就通过外包的形式增加了网页级的搜寻。中文网站供应书目搜寻的远多于供应网页搜寻的,加之媒体的各种炒作,很多网民误以为网站书目的搜寻功能就是搜寻引擎。在美国,因特网搜寻引擎通常指的是收集了因特网上几千万到几亿个网页并对网页中的每一个词进行索引的搜寻服务系统,是基于网页的全文检索系统。误区2、搜寻引擎就是门户站点假如你要供应搜寻服务,大家就认为你是一个门户网站,你就要吸引用户、提高页视率(PageView)。事实上,搜寻引擎完全可以为内容供应商(ICP)、门户网站供应专业的搜寻服务,而不必干脆面对用户,这是一种典型的应用服务供应(ASP)模式。误区3、搜寻引擎的概念已经过时搜寻引擎是互联网上最先商业化的一个应用服务,它对于帮助网民快速找寻到所须要的信息特别关键。因特网搜寻引擎是一个全自动的软件服务,并且特别简单在搜寻结果网页中插入具有很高针对性的广告,CPM 最高可达70美元;所以一旦投入运转,其收益与成本的比率远高于一般的网站内容服务。依据中国互联网信息中心(CNNIC)2000年1月的统计结果,在中国网民中,搜寻是排在电子邮件之后的其次大互联网应用。误区4、中文搜寻引擎技术已经成熟不要说中文,即使英文的搜寻引擎也没有发展成熟。这一方面表现在新的搜寻引擎公司层出不穷,如Google, Ask Jeeves等;另一方面更表现在美国前三大网站都外包了它们的网页搜寻部分。事实上,美国在线、雅虎和微软网络的搜寻服务都是由一家叫Inktomi 的公司供应的。这是因为搜寻引擎技术改变特别快,这些网站无法自行跟踪最前沿的技术。之所以有人会有搜寻引擎技术已经成熟的概念,其实是因为网站门户公司意识到了它们的特长并不是搜寻技术的创新,而是互联网上大众品牌的建立。中文搜寻引擎技术出现的时间并不比英文的晚多少,然而发展速度却远远赶不上英文,这是由于网页级搜寻引擎的开发难度相当大,该方面的专业人才奇缺,有开发这种搜寻引擎阅历的人,即使在硅谷也属凤毛麟角,开发所须要的硬件要求也比一般的网页制作高出许多。百度公司结合硅谷搜寻引擎人才精英,依托北京最优秀的软件人才,开发了大型商业化的中文搜寻引擎,中文搜寻从今与英文站在了同一起跑线上。误区5、中文搜寻引擎速度很慢某些中文网站的网页搜寻服务外包给了一些服务器在境外的应用服务供应商(ASP),如AltaVista或Openfind等, 由于用户搜寻须要占用出国带宽,因而速度极慢。这不是中文搜寻引擎的错,而是这些网站没有选对ASP 所致。误区6、中英文混合检索词是不被支持的当你输入“MP3” 时,有些网站会认为你在查找英文网页,进而自动将你送到一个英文搜寻引擎上;更多的网页搜寻服务不能对“甲A”、“F-1一级方程式”等中英混合查询作出恰当的反应。然而搜寻技术并非对此无能为力,百度搜寻就完全解决了中英文混查的问题。误区7、中文搜寻引擎的相关性无法与英文相媲美中文与英文最大的不同之处在于中文中有词的概念,检索字串与网页中文字的简洁匹配并不见得就是语义上的匹配;要想提中学文搜寻的相关性,必需结合中文词和中文字,并运用一些先进的算法,如新一代信息检索(IR)算法、超链分析(Link Analysis)等。中文搜寻也有很多英文搜寻望尘莫及之处,如中文网页极少有针对搜寻引擎的欺瞒(Spamming)行为,中文没有单复数、时态等的改变,大多数先进的算法也完全适用于中文。中文搜寻的相关性完全可以与英文媲美。百度搜寻运用了目前国际上先进的搜寻引擎技术,并结合中文的语言特点和文化特点,胜利地解决了中文搜寻的相关性问题。

    注意事项

    本文(2022年中文搜索引擎的十大误区搜索研究教程.docx)为本站会员(l***)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开