语义搜索:数字出版的突破?
2011-08-25 08:52:16.0 来源:时代周报 责编:张招伟
- 摘要:
- 2011年8月22日,南国书香节现场,广州华阅数码科技公司和汕头大学出版社签订战略合作协议。由于合作涉及新的数字版阅读平台、意义搜索等内容,这对于方兴未艾的中国数字出版市场来说,可能带来的影响值得关注。加上这次合作还拥有一定的官方背景,广东省新闻出版局、广东数字出版产业联合会都给予了支持。
【CPP114】讯:2011年8月22日,南国书香节现场,广州华阅数码科技公司和汕头大学出版社签订战略合作协议。由于合作涉及新的数字版阅读平台、意义搜索等内容,这对于方兴未艾的中国数字出版市场来说,可能带来的影响值得关注。加上这次合作还拥有一定的官方背景,广东省新闻出版局、广东数字出版产业联合会都给予了支持。
“数字出版本身是广东的强项,我们一直立足于成为这方面的全国标兵。”广东省新闻出版局数字出版管理处处长、广东数字出版产业联合会执行副会长苏毅接受时代周报记者采访时难掩雄心。实际上,早在2010年,苏毅就曾表示,成立广东省数字出版产业联合会是要进一步加强数字出版产业链上中下游的战略合作。华阅数码和汕头大学出版社的合作无疑是其中的重要一步。
前景在于内容技术并济
广东数字出版产业起步较早,2008年全国数字出版总收入530亿元,其中广东占100亿元;2009年全国预计达750亿元,广东占150亿元。在去年第三届中国数字出版博览会上,广东是获奖最多的省份,并囊括了业界公认难度最大的“创新技术奖”过半奖项。苏毅所在的科技与数字出版处也是全国在这个方面的首创。
“而2011年全国数字出版产值将高达1000亿元。”汕头大学出版社社长胡开祥认为市场前景非常可观。华阅数码有两款数字阅读平台“读览天下”以及中文名为“扎克”的ZAKER,而汕大出版社则拥有语义搜索技术的优势。其中,“读览天下”除了iPad外,还支持安卓、Kindle、汉王、索尼等的阅读器,用户可以通过这个平台下载各种合法出版物,目前已加盟的有1500种杂志、30000本图书和上百家不同出版社。
2010年12月,“读览天下”推出基于iPad操作系统的免费阅读软件ZAKER。这款软件支持用户个性化信息搜索,能将互联网资讯、报纸杂志等和微博联系到一起并自动抓取到用户的平板电脑上,再重新排版成类似电子杂志的形态。用户还可以转发或评论内容至微博。不过,与会人士也承认,目前国内的数字化阅读产业发展还仅限于把书报刊的内容简单转为电子载体适用的形式,也就是内容没有变化,仅做技术上的调整。“往往手机和互联网的固有特性被忽略。”华阅数码CEO陈迟认为。对此,胡开祥也表示“数字化出版和阅读的最后赢家永远是内容出版社,如著名的汤姆森公司”。苏毅则认为:“数字出版前15年的发展过程中,一直都是技术为王,只有内容和技术共同拉动,才能真正发展。”
语义搜索的突破
正在受到关注的语义搜索技术,可能成为带动内容突破的重要因素。对于大部分用户来说,语义搜索依然陌生,这项技术正是一些IT巨头密切关注的新战场。曾经的王者、被苹果和谷歌抢去风头的微软,已经在语义搜索这个方面抢得了一些先机—微软此前推出了新一代搜索引擎Bing(必应)。
所谓语义搜索,通俗地解释,就是搜索引擎需要越来越懂用户的意图,抓取用户最想知道的网页内容—除了文本,还有图片、视频等多媒体内容。
“我们把必应称为"决策引擎",因为其用途特点在于能够智能分析搜索目标。”微软中国公关总监王岩对时代周报记者表示。“传统的搜索是以关键词为核心的,而语义搜索则是围绕主题词展开。所以搜索结果并一定因为文本里出现了最多搜索词,而是根据主题意思展开的。”胡开祥解释。在目前的搜索引擎市场里,谷歌遵循的是一条“客观主义”的搜索路线,也就是不问评价者和用户之间的关系,只根据内容所在网页的技术权重进行筛选。而微软选择的语义搜索考虑人际关系,把用户值得信任的人发布的信息在搜索结果中排序靠前。这已经有把“社交网络”和“搜索引擎”混在一起的味道了。微软早在2008年就购买了语义搜索引擎Powerset,开始在这个市场布局。
某种程度上,对语义搜索的争夺将逐渐使目前的国际搜索引擎市场白热化。2010年年底,调研机构comScore公布了美国搜索引擎当年11月的市场份额,谷歌依然是老大,微软的bing还是排在雅虎之后做老三,市场份额为11.8%,但相对于谷歌和雅虎的略微下滑各0.1%,bing则有0.3%的小幅增长。
中国搜索引擎霸主百度也在10个月前推出“框计算”战略,百度首席执行官李彦宏的宏伟构想是,通过语义分析预知用户需求,比如说,当你输入“5万美元”时,将被带到一个汇率换算网站;当输入“北京上海”时,将出现一个航班清单—这些内容都将显示在结果页的一个方框中。
语义搜索与数字出版
抛开这些跨国公司的争夺,对于数字出版行业来说,语义搜索技术是他们利用技术使内容升级的一个希望。
“通过语义搜索技术,我们可以对目前的微博内容进行梳理。”胡开祥进一步解释,“大家都喜欢看微博,但是无效信息很多。比如我们想看经济学家的经济观点,不想看到他的私生活,这时候语义搜索可以对微博内容进行筛选,把我们需要的内容分门别类归好”。
同样,用这个技术进行书本整理,也是盈利的重要手段。传统的书本搜索只是将关键词的位置搜索出来,语义搜索技术,可以从字词句、篇章、语用和逻辑三个层面将文章的内涵分解出可以识别的结构性信息“碎片”,然后以“百科阅读”、主题阅读等形式呈现出来。
“我们对一本20万字的书进行整合梳理,如果收1000元的费用,那么市场前景就相当广泛。要知道,全国一年出版的书籍超过20万种。”胡开祥这样展望。
【点击查看更多精彩内容】
相关新闻:
《数字印刷管理办法》:鼓励数字出版物
淘花解决数字出版渠道难题
2011亚太数字出版:出版业的数字化转型
天津国家数字出版基地云计算中心将正式开放
“数字出版本身是广东的强项,我们一直立足于成为这方面的全国标兵。”广东省新闻出版局数字出版管理处处长、广东数字出版产业联合会执行副会长苏毅接受时代周报记者采访时难掩雄心。实际上,早在2010年,苏毅就曾表示,成立广东省数字出版产业联合会是要进一步加强数字出版产业链上中下游的战略合作。华阅数码和汕头大学出版社的合作无疑是其中的重要一步。
前景在于内容技术并济
广东数字出版产业起步较早,2008年全国数字出版总收入530亿元,其中广东占100亿元;2009年全国预计达750亿元,广东占150亿元。在去年第三届中国数字出版博览会上,广东是获奖最多的省份,并囊括了业界公认难度最大的“创新技术奖”过半奖项。苏毅所在的科技与数字出版处也是全国在这个方面的首创。
“而2011年全国数字出版产值将高达1000亿元。”汕头大学出版社社长胡开祥认为市场前景非常可观。华阅数码有两款数字阅读平台“读览天下”以及中文名为“扎克”的ZAKER,而汕大出版社则拥有语义搜索技术的优势。其中,“读览天下”除了iPad外,还支持安卓、Kindle、汉王、索尼等的阅读器,用户可以通过这个平台下载各种合法出版物,目前已加盟的有1500种杂志、30000本图书和上百家不同出版社。
2010年12月,“读览天下”推出基于iPad操作系统的免费阅读软件ZAKER。这款软件支持用户个性化信息搜索,能将互联网资讯、报纸杂志等和微博联系到一起并自动抓取到用户的平板电脑上,再重新排版成类似电子杂志的形态。用户还可以转发或评论内容至微博。不过,与会人士也承认,目前国内的数字化阅读产业发展还仅限于把书报刊的内容简单转为电子载体适用的形式,也就是内容没有变化,仅做技术上的调整。“往往手机和互联网的固有特性被忽略。”华阅数码CEO陈迟认为。对此,胡开祥也表示“数字化出版和阅读的最后赢家永远是内容出版社,如著名的汤姆森公司”。苏毅则认为:“数字出版前15年的发展过程中,一直都是技术为王,只有内容和技术共同拉动,才能真正发展。”
语义搜索的突破
正在受到关注的语义搜索技术,可能成为带动内容突破的重要因素。对于大部分用户来说,语义搜索依然陌生,这项技术正是一些IT巨头密切关注的新战场。曾经的王者、被苹果和谷歌抢去风头的微软,已经在语义搜索这个方面抢得了一些先机—微软此前推出了新一代搜索引擎Bing(必应)。
所谓语义搜索,通俗地解释,就是搜索引擎需要越来越懂用户的意图,抓取用户最想知道的网页内容—除了文本,还有图片、视频等多媒体内容。
“我们把必应称为"决策引擎",因为其用途特点在于能够智能分析搜索目标。”微软中国公关总监王岩对时代周报记者表示。“传统的搜索是以关键词为核心的,而语义搜索则是围绕主题词展开。所以搜索结果并一定因为文本里出现了最多搜索词,而是根据主题意思展开的。”胡开祥解释。在目前的搜索引擎市场里,谷歌遵循的是一条“客观主义”的搜索路线,也就是不问评价者和用户之间的关系,只根据内容所在网页的技术权重进行筛选。而微软选择的语义搜索考虑人际关系,把用户值得信任的人发布的信息在搜索结果中排序靠前。这已经有把“社交网络”和“搜索引擎”混在一起的味道了。微软早在2008年就购买了语义搜索引擎Powerset,开始在这个市场布局。
某种程度上,对语义搜索的争夺将逐渐使目前的国际搜索引擎市场白热化。2010年年底,调研机构comScore公布了美国搜索引擎当年11月的市场份额,谷歌依然是老大,微软的bing还是排在雅虎之后做老三,市场份额为11.8%,但相对于谷歌和雅虎的略微下滑各0.1%,bing则有0.3%的小幅增长。
中国搜索引擎霸主百度也在10个月前推出“框计算”战略,百度首席执行官李彦宏的宏伟构想是,通过语义分析预知用户需求,比如说,当你输入“5万美元”时,将被带到一个汇率换算网站;当输入“北京上海”时,将出现一个航班清单—这些内容都将显示在结果页的一个方框中。
语义搜索与数字出版
抛开这些跨国公司的争夺,对于数字出版行业来说,语义搜索技术是他们利用技术使内容升级的一个希望。
“通过语义搜索技术,我们可以对目前的微博内容进行梳理。”胡开祥进一步解释,“大家都喜欢看微博,但是无效信息很多。比如我们想看经济学家的经济观点,不想看到他的私生活,这时候语义搜索可以对微博内容进行筛选,把我们需要的内容分门别类归好”。
同样,用这个技术进行书本整理,也是盈利的重要手段。传统的书本搜索只是将关键词的位置搜索出来,语义搜索技术,可以从字词句、篇章、语用和逻辑三个层面将文章的内涵分解出可以识别的结构性信息“碎片”,然后以“百科阅读”、主题阅读等形式呈现出来。
“我们对一本20万字的书进行整合梳理,如果收1000元的费用,那么市场前景就相当广泛。要知道,全国一年出版的书籍超过20万种。”胡开祥这样展望。
【点击查看更多精彩内容】
相关新闻:
《数字印刷管理办法》:鼓励数字出版物
淘花解决数字出版渠道难题
2011亚太数字出版:出版业的数字化转型
天津国家数字出版基地云计算中心将正式开放
- 关于我们|联系方式|诚聘英才|帮助中心|意见反馈|版权声明|媒体秀|渠道代理
- 沪ICP备18018458号-3法律支持:上海市富兰德林律师事务所
- Copyright © 2019上海印搜文化传媒股份有限公司 电话:18816622098