当前位置:网站首页>搜索引擎的日常挑战_4_外部异构资源 - 知乎
搜索引擎的日常挑战_4_外部异构资源 - 知乎
2020-11-08 07:14:00 【osc_cudh2wh2】
写在前面:
搜索引擎是个极其复杂的系统工程,搜索引擎上并不会大力出奇迹,需要一点点打磨。 本系列记录日常遇到的问题,以管窥豹的方式,一点点展现搜索引擎的魅力之处。
开始正文:
移动生态的孤岛效应越来越明显,但彼此又有一定的关联合作。对于通用搜索引擎而言,不可能所有资源、生态都一一满足,一定会引入外部资源。
相比于京东、携程、美团等虽然每天也都有大量的搜索,但是和通用搜索不同的是,它们检索的内容都是自家生态产出,或是结构化内容。这一点上不用像通用搜索引擎一样,承受此类"痛苦"。

外部资源的引入和检索主要的方式是阿拉丁暴露接口和卡的方式提供服务。也有小程序跳转提供服务。

(所以现在各家大厂都在大力建设自己生态内的内容,规范的格式化数据,也便于管理。如头条号、百家号、企鹅号、甚至是知乎专栏。)
但当资源需要融合到搜索引擎综合结果展示页时,就会带来很多需要思考的问题:
1 外部的提供方式,是建库,还是请求api的方式。建库的量级?导流的量级?能否抗住。两者方式各有优劣,要先想明白。
2 建库的话如何建?是和本身大库融合建在一起?还是单独建库?两者方式也是各有优劣。
3 建库的字段、召回、排序的字段如何对齐?缺失字段如何处理?
4 排序侧融合的方式,以及生态上到考量。
5 可扩展性的考虑,如何将标准、入库、排序等各个阶层工作尽可能可复用,尽可能统一化管理。
6 api引入方式引入的资源,在其内容理解方面,几乎很难搞。
6 审核运营控制。没有审核方式,内容不受控,若是出现敏感、低俗内容影响可能会很大。若是入库的方式还好些,api方式的话是个问题。
版权声明
本文为[osc_cudh2wh2]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4328465/blog/4707812
边栏推荐
- GoLand writes a program with template
- Web Security (3) -- CSRF attack
- 模板链表类学习
- About the promotion of the whole stack of engineers, from the introduction to give up the secret arts, do not click in to have a look?
- VC6兼容性及打开文件崩溃问题解决
- PCR and PTS calculation and inverse operation in TS stream
- 16.文件传输协议、vsftpd服务
- On the concurrency of update operation
- Windows subsystem Ubuntu installation
- Lay UI left tree Dtree right list table
猜你喜欢
Learn Scala if Else statement
Qt混合Python开发技术:Python介绍、混合过程和Demo
Privacy violation and null dereference of fortify vulnerability
高并发,你真的理解透彻了吗?
Ulab 1.0.0 release
Sum up some useful functions
个人短网址生成平台 自定义域名、开启防红、统计访问量
Swiper window width changes, page width height changes lead to automatic sliding solution
PCR and PTS calculation and inverse operation in TS stream
Mouse small hand
随机推荐
Swiper window width changes, page width height changes lead to automatic sliding solution
Everything is 2020, LINQ query you are still using expression tree
麦格理银行借助DataStax Enterprise (DSE) 驱动数字化转型
Lay UI left tree Dtree right list table
Supervisor process management installation and use
Qt混合Python开发技术:Python介绍、混合过程和Demo
Insight -- the application of sanet in arbitrary style transfer
The road of cloud computing: a free AWS cloud server
VC6 compatibility and open file crash resolution
Introduction to ucgui
C language I blog assignment 03
QT hybrid Python development technology: Python introduction, hybrid process and demo
Ladongo open source full platform penetration scanner framework
Abnormal + Abstract
尾-递
China Telecom announces 5g SA commercial scale in 2020
The real-time display of CPU and memory utilization rate by Ubuntu
Sum up some useful functions
Web Security (3) -- CSRF attack
京淘项目知识点总结