2016年7月26日上午,一封上線通知發(fā)送到了中國(guó)移動(dòng)通信集團(tuán)的所有部門,這標(biāo)志著由中國(guó)移動(dòng)蘇州研發(fā)中心自主研發(fā)的OA搜索系統(tǒng)正式在集團(tuán)范圍內(nèi)上線試用。
OA系統(tǒng)是移動(dòng)內(nèi)部最常用的辦公信息系統(tǒng),系統(tǒng)使用者們對(duì)于公文的搜索功能要求很高,且由于集團(tuán)OA系統(tǒng)數(shù)據(jù)量龐大,公文種類繁多,對(duì)于底層數(shù)據(jù)的抽取整合、重新建立索引的工作量也非常大。蘇州研發(fā)中心大數(shù)據(jù)部搜索引擎組的小伙伴們,通過(guò)近半年的辛苦奮斗,終于克服種種困難,將OA搜索系統(tǒng)成功上線啦!
在本次項(xiàng)目過(guò)程中,最大的困難來(lái)源于數(shù)據(jù)源種類多,數(shù)據(jù)量大,且由于底層數(shù)據(jù)庫(kù)建設(shè)時(shí)間久遠(yuǎn),所以缺乏文檔和技術(shù)類支撐。在比較艱難的情況下,大數(shù)據(jù)部搜索引擎組的小伙伴們共完成配置文件1萬(wàn)余行,配置文種30大類,254小類,數(shù)據(jù)抽取共計(jì)30余萬(wàn)條,建立清洗規(guī)則80余條,最后成功“啃”掉了底層數(shù)據(jù)這個(gè)大難題,玩兒轉(zhuǎn)了底層老舊的數(shù)據(jù)庫(kù)。有了數(shù)據(jù),那么剩下的問(wèn)題就是用我們蘇小研的搜索引擎產(chǎn)品BC-SE構(gòu)建搜索系統(tǒng)啦!
說(shuō)到構(gòu)建搜索引擎系統(tǒng),這絕對(duì)是蘇小研的BC-SE產(chǎn)品的強(qiáng)項(xiàng):分布式的搜索引擎系統(tǒng)架構(gòu)、豐富的搜索接口、優(yōu)化的中文語(yǔ)義理解模塊、高效的搜索流程設(shè)計(jì)等等,這些都是BC-SE的必殺技!同時(shí),區(qū)別于市場(chǎng)上其他的企業(yè)級(jí)搜索引擎,BC-SE提供了優(yōu)質(zhì)的搜索運(yùn)營(yíng)服務(wù)功能,提供搜索熱詞查詢、高級(jí)搜索后臺(tái)配置、結(jié)果置頂/屏蔽、多租戶管理等搜索運(yùn)營(yíng)服務(wù),將搜索能力以平臺(tái)化、能力化提供,可以為其他信息系統(tǒng)提供方便、快捷、一站式的搜索服務(wù)。
這次蘇小研為集團(tuán)提供的OA搜索系統(tǒng),采用了先進(jìn)的分布式搜索引擎架構(gòu),同時(shí)在系統(tǒng)中加入了具有移動(dòng)特色的中文詞庫(kù)優(yōu)化搜索分詞效果(詞庫(kù)是由BC-SE的“新詞發(fā)現(xiàn)”功能通過(guò)自然學(xué)習(xí)算法提煉出來(lái)的哦。,提供了基于相似度、時(shí)間、組合篩選條件等豐富的搜索接口,且搜索響應(yīng)時(shí)間基本穩(wěn)定在100ms以內(nèi),從搜索效果和搜索速度上均滿足了日常用戶對(duì)于OA公文搜索的需求。
在本次OA搜索項(xiàng)目開發(fā)上線過(guò)程中,蘇研北京技術(shù)支持中心也給予了大力的支持和配合,北支的小伙伴們和大數(shù)據(jù)部的小伙伴們一直緊密合作,全力解決線上線下的各種問(wèn)題。同時(shí),也要感謝政企公司的小伙伴,從中協(xié)調(diào)資源,推進(jìn)項(xiàng)目進(jìn)度。大家一起奮斗的感覺,真的很好!
未來(lái)蘇小研的搜索引擎團(tuán)隊(duì),將會(huì)更加致力于搜索效果和搜索系統(tǒng)架構(gòu)的優(yōu)化工作,為各類信息系統(tǒng)提供穩(wěn)定、高效的搜索服務(wù),做最好最穩(wěn)定的企業(yè)級(jí)搜索引擎!