?對話360數科費浩峻:用「AI+大數據」講好增長的故事

引語:360數科的進擊之路——從探索者、從業(yè)者再到科技賦能者。
“從再造到賦能”這是360數科2022年技術開放日的主題,站在金融科技新的發(fā)展階段下,這一次,360數科更加強調自己是科技賦能者這一角色。
過去很長一段時間,金融科技經歷了金融電子化、金融信息化、互聯網金融再到金融科技階段。尤其互聯網金融經歷了野蠻生長后進入市場調整期,不合規(guī)平臺淘汰出局,行業(yè)重新洗牌。
金融科技飛速發(fā)展的這幾年,讓我們真實地看到了什么是“科技驅動商業(yè)”。在金融科技發(fā)展的支持下,技術、場景、金融的融合發(fā)展也創(chuàng)造了金融服務新的獲客模式、風控模式和盈利模式。因此在這一階段下,金融科技公司必須進一步增強科技服務金融的能力。
彼時,科技+金融的結合方式成為了多數互聯網平臺的轉型新選擇。而360數科也經歷了從市場的連接者到流程再造者的技術演化歷程,從以往的探索者、從業(yè)者到如今的科技賦能者,注定是一條艱辛的道路。
那么360數科身份轉換背后的意義是什么?站在新的時代背景下,360數科又交出了怎樣的答卷呢?
在360數科第二屆技術開放日會后,雷峰網與360數科首席算法科學家費浩峻展開了對話。
360數科首席算法科學家費浩峻
360數科結“科技”硬寨,打硬仗
回望金融科技過去十幾年的激蕩發(fā)展歷程,從早期“數據大集中”的開展、網上銀行的設立到互聯網金融浪潮的來襲與消退,再到如今金融與人工智能、區(qū)塊鏈、云計算、大數據等為代表的現代信息技術深度融合、邁向智能化。
技術的發(fā)展,讓傳統金融業(yè)面臨新的機遇。而金融與科技的深度融合,也為金融行業(yè)的發(fā)展找到更多的發(fā)展可能性。
早在席卷整個互聯網金融行業(yè)的嚴厲政策監(jiān)管到來之前,諸多互聯網金融巨頭已經感受到了僅僅只是收割流量,而不去做深度改變金融行業(yè)的操作是一個死胡同。于是,他們早早地便開始了轉型,并且試圖尋找一種科技與金融行業(yè)結合的最佳方式。
以BAT為代表的互聯網巨頭開始強調自己的科技屬性,以更加明確自身的定位——即互聯網金融不再僅僅只是一個獲取用戶的手段,而是能夠給傳統金融行業(yè)帶來真實改變的東西。
打贏這場硬仗不容易,360數科苦煉內功,強化營銷、運營、風控三大核心技術能力。面對來自互聯網大廠的壓力,360數科也只有結硬寨,才能打硬仗。
費浩峻告訴雷峰網:“只有擁有基礎的科技能力,才能讓科技與金融更好的融合,創(chuàng)造產出更多新產品,比如智能風控、智能獲客、智能客服以及網絡安全等?!?
對于從業(yè)者到賦能者身份轉換的意義,360數科CTO王繼平也在會上表示:“如果我們只作為從業(yè)者,在這個行業(yè)里我們就只是1,而如果我們成為行業(yè)的賦能者,我們就能從1到100,讓技術釋放出更大的能量。唯有以技術重構價值鏈,把自身技術能力逐步開放,賦能給全行業(yè),方能打破增長瓶頸,迎來發(fā)展第二曲線?!?
以“AI+大數據”搭橋
“科技怎么更好的賦能金融行業(yè),這是社會給我們的問題,也是360數科的使命?!辟M浩峻如是說。
伴隨新一輪科技革命和產業(yè)變革的不斷深入,對于傳統金融行業(yè)而言,數字化轉型是企業(yè)實現長期、可持續(xù)發(fā)展的必經之路。但謀求線上化轉型的同時,猶如硬幣的兩面,一面是商業(yè)線上化發(fā)展的必然趨勢,另一面則是數字化轉型過程面臨的種種困難。如何找到“流量密碼”并真正服務于金融業(yè)務發(fā)展,成為了一道必答題。
例如,獲客方面,由于線下渠道受限,有效場景缺失,傳統線下獲客困難,金融企業(yè)亟需尋找更加智能、便捷的營銷增長入口。
雷峰網了解到,截至目前360數科注冊用戶已超過1.9億、撮合交易量突破萬億大關,獲客方面已經取得了行業(yè)第一的投放規(guī)模。
360數科取得如此亮眼成績的背后,到底是什么在支撐?
在費浩峻看來,大數據和AI是這個時代下促動整個行業(yè)進步的源動力。確實,科技可以更好的為金融等行業(yè)服務已經是所有人的共識。
360數科這些喜人數據的背后,是其基于大數據和AI打造出的第二代增長引擎Glaucus超級大腦。
目前,Glaucus引擎已經接入了中國95%的全網流量,不管是主流媒體平臺還是手機廠商都已經進行了深度合作。
費浩峻表示:“Glaucus引擎可以說是業(yè)內第一的增長引擎,不僅在金融行業(yè),在整個科技行業(yè),從接入的流量、并發(fā)量、以及處理數據的復雜度、轉換效果都能拔得頭籌?!边@不僅得益于公司的整體支持,同時在團隊方面,其成員也都是來自一線大廠的人才。
Glaucus超級大腦,每天能進行270億次的運算,能在2ms內快速判斷流量價值、流量的競爭力以及流量最適配的創(chuàng)意,并將出價系數和創(chuàng)意ID返回媒體, 峰值可達到每秒鐘處理41w次請求。
具象一點理解,每天處理270億次請求,是什么概念?全球60多億人,每人每天可能有四次服務的機會;而2ms是引擎每處理一次請求的時間,類比一下,人的神經元大概的反應時間是100ms,而Glaucus引擎反應的時間大概是它的50倍。每秒鐘最大處理41w次請求,如果換成分鐘,那就是2400萬次,相當于一分鐘的時間可以把全北京的人服務一遍。
再用兩個數字來看,“一小時”“一天”能做什么呢?Glaucus實時模型每小時自迭代一次,用戶是否參與競爭流量?是否有競得流量?轉換如何?所有的用戶行為形成一套模型實時反饋到業(yè)務層;同時,離線模型的迭代周期也控制在一天,因為用戶長期的行為反饋是離線的,這都是因為Glaucus有超強的自學習迭代能力。另外,Glaucus引擎還有自動化投放管理能力,可以根據市場和賬戶的變化,對賬戶出價進行自動化微調,對賬戶計劃進行自動扶持和關停。
在流量競爭日益激烈的環(huán)境下,360數科逆流而上。自5月以來,Glaucus已幫助360數科在整個信息流的核心用戶獲取能力上提升了40%,優(yōu)質客群也較年初提升了20%,獲客效率優(yōu)化了30%。
費浩峻告訴雷峰網:“獲客的本質還是服務,360數科就是把真實而正確的產品價值傳遞給不一樣的用戶。”
在客戶與金融機構之間,360數科扮演著搭“橋”的角色,用數字化的方式讓銀行實現增長的同時,幫助個人及小微企業(yè)更好的貸款,助推實體產業(yè)的增長。而銀行也愿意把互聯網營銷獲客的事情交給更專業(yè)的第三方,從而幫它觸及到更多他原本觸及不到的潛在客戶。
只有讓錢流動起來,才能盤活更多的市場,帶動金融行業(yè)的增長。
“雖然學界有很多很難很厲害的算法,但是我很早給自己的定位,就是架起學界和工業(yè)界的橋梁,把好的算法應用到工業(yè)界?!辟M浩峻作為一個在算法和增長領域研究多年的工程師、架構師,他希望作為科技行業(yè)從業(yè)者的一份子,能夠切切實實幫助和影響到人。而這與360數科的使命不謀而合——大時代下的小使命——用科技賦能金融行業(yè)。
以“運營和服務”為馬
據費浩峻介紹,他是2021年5月正式加入360數科,目前主要負責三個團隊:數據生態(tài)團隊、數據挖掘團隊以及業(yè)務模型團隊,主要職責是橫向支撐公司內部的業(yè)務場景,其中對業(yè)務支撐最重的工作主要是增長還有客戶經營。
在增長方面,上文提到Glaucus在增長行業(yè)打出了一個特別漂亮的仗,整個過程僅僅用了一年的時間。
一年的時間,360數科不僅于營銷增長上取得較大突破,在精細化運營方面和AI基礎能力建設上,也做了很多建設性的內容。
第一,大模型計算能力。大模型被認為是AI未來的核心發(fā)展方向,也是各個行業(yè)及企業(yè)必爭之地。目前,數科的計算有17億的頂點,200億條邊,另外自主研發(fā)的CAST的算法較業(yè)內最流行的算法在各個共有的數據集的評估上都要高3%的絕對點。這套算法也支撐了Glaucus底層的運算和處理。
第二,視覺上OCR系統。360數科在ICDAR 2019 SROIE國際大賽OCR單項任務中,拔得頭籌。ICDAR(國際文檔分析與識別大會)有著“OCR奧斯卡”之稱,360數科在競賽中提出了一種基于RARE改進的新文本識別算法,并與優(yōu)化后的CRNN模型進行了模型融合,還利用大規(guī)模公開數據集用于預訓練模型,同時應用已訓練完成的自然語言模型,糾正文本識別中的錯誤。目前360數科已經覆蓋了500多個金融場景,在一些業(yè)務場景中字段精度均高達95%以上。
第三,知識圖譜。知識圖譜是大多數企業(yè)做決策的神經中樞,數科自主研發(fā)的金融知識圖譜,融合了其重點服務的五個行業(yè),1900多萬家企業(yè),進行精細化的風險管控和經營。
費浩峻表示:“經營就是讓用戶留下來,因此只有服務好用戶才會讓用戶留下來。360數科的第一個優(yōu)勢就是比別人服務好,第二是因人而異做定制化服務,做到千人千面模型?!?
目前通過精細化運營的實踐和能力建設,360數科的用戶標簽達到30個大類1000+的數量,支持秒級的實時策略,海量并發(fā)支持千萬級別的用戶互動。精細化運營實現了顯著的降本增效,30分鐘之內可以完成從策略創(chuàng)建到用戶互動的全流程,過去一年里,公司運營人效提升6倍,放款額提升20%。
在智能營銷以及精細化經營方面,360數科確實花了很大的力氣。費浩峻坦言,這一過程不容易,但是太容易的東西反而沒有太多技術門檻,作為數科領域的頭部公司,擔當還是要有的,不能因為難就不去做,去不斷探索行業(yè)的新模式,不斷突破,才能真正幫助人,賦能不僅僅是一句口號。
中小企業(yè)融資難、融資貴,到現在為止還是一個比較突出的問題。對于小微企業(yè),360數科也做了相應助力,在金融知識圖譜中,這些中小微企業(yè)的信息,包括了上下游、行業(yè)規(guī)模、盈利性所在的城市,通過這些信息360數科對每個小微企業(yè)做定制化的風控產品和經營模式,例如提供招投標信息、供應鏈信息、亦或是一筆資金,小微企業(yè)更需要能長久陪伴其成長的服務。360數科真正做到了精細化的運營服務。
目前,360數科在金融和增長行業(yè),逐漸成為了“領頭羊”。但是其還在不斷探索新的技術以及服務模式,為行業(yè)更好的賦能。
費浩峻的“攻守之道”
費浩峻認為,不斷探索科技的上限,用科技服務行業(yè)是“攻之道”,那么作為一個科技從業(yè)者,更應該懂“守之道”,科技是應該要守住一些底線的。
從進入這個行業(yè)開始,費浩峻就夢想能夠用科技改變行業(yè),真正走到這個位置上,發(fā)現一舉一動都能影響很多人,同時也發(fā)現這個行業(yè)也充斥著很多不好的東西,所以作為科技人,更多應該想想怎么樣守住底線?
費浩峻認為三個守是:守住產品底線、數據底線還有科技倫理底線。
第一,產品底線。產品的底線就應該是服務和賦能。而360數科的所有AI系統都會服務于和用戶交互的每一個階段,在每一個階段都會有視頻和語音的質檢,保證其傳遞服務的真實性。
第二,數據底線。大數據時代的到來,讓越來越多用戶的數據被盜賣,用戶的利益受到了極大的損失。360數科的數據底線,就是保護用戶的每一個數據,這是紅線。在360數科內部,從數據進入公司之后,會進行數據的加密、脫敏,再進行存儲,數據流動的整個過程都是可被追蹤和審計的,內部員工也根本看不見數據;同時,利用隱私安全計算引擎,數據也可以被提取到外部使用,目前該平臺已經實現了百萬級的樣本高效聯合建模。
第三,科技倫理底線??萍际前央p刃劍,只有堅守倫理的底線才能不讓科技這把劍砍偏。一些黑灰產通過圖像篡改技術,讓不合規(guī)的創(chuàng)意通過媒體審核,而有底線的科技公司使用OCR技術是做差異化定制化的服務。因此,360數科內部已經形成了一個層層審核的機制,保障用戶利益。
那么360數科是如何保證每項技術都可以用在正確的地方呢?
據介紹,首先,所有的技術都會通過一套嚴格的評審機制,讓技術委員會評審;其次,ESG評審機制會穿插在技術啟動以及業(yè)務開展的每一個環(huán)節(jié);再次,公司進行正確的價值引導,讓正確的倫理價值觀深入到每個數科人骨子里。
正如費浩峻所說,“AI沒有原罪,有罪的是使用的人?!?
作為脫胎于大安全的360數科,深知只有在安全的基礎上用好數據,才能真正發(fā)揮數據的價值,從而推動金融行業(yè)的發(fā)展。
本文系作者:
小莊
授權發(fā)表,鳥哥筆記平臺僅提供信息存儲空間服務。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》
如對文章、圖片、字體等版權有疑問,請點擊
反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯想;
5)展現血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯。
6. 傳播封建迷信,主要表現為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現為:
1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)