777精品出轨人妻国产,熟女av人妻一区二区三四区,国产精品无码中文在线av,美脚パンスト女教师在线观看

揭秘算法推薦:統計、分類與分發織成信息牢籠!

原創 收藏 評論
舉報 2022-06-29


“讓人類永遠保持理智,確實是一種奢求”?!读骼说厍颉分蠱OSS直到毀滅,也沒弄明白航天員劉培強為什么甘愿赴死。

MOSS是人類已經能夠制造出推動地球航行的行星發動機,科技來到新高度下的高級人工智能,但與007這樣具有自主智慧的人工智能還相距甚遠,本質上與現在通過數據層、算法層、應用層給用戶帶來最優解的算法推薦是一樣的。

01. 什么是算法推薦?

談及算法推薦,大部分人腦子可能閃過的第一個詞就是“今日頭條”。的確,字節跳動旗下的今日頭條、抖音等產品在推薦算法的賦能下,給大眾留下了千人千面的深刻印象。

其實,除字節跳動外,阿里巴巴在天貓、淘寶,網易在網易云音樂,B站在視頻推薦流中都有廣泛使用推薦算法??梢院敛豢鋸埖恼f,互聯網行業中只要不是用戶主動尋找的直接信息,甚至是廣告背后都有推薦算法的身影。

1994年,美國美國明尼蘇達大學GroupLens研究組推出第一個自動化推薦系統 GroupLens,提出了將協同過濾作為推薦系統的重要技術,也是最早的自動化協同過濾推薦系統之一。

4年后(1998年),亞馬遜上線了基于物品的協同過濾算法,這便是算法推薦的最早商用案例,后面Facebook、Netflix,乃至中國的字節跳動、阿里巴巴等企業都廣泛應用了算法推薦。

其實算法推薦并不復雜,總結起來就是信息的“統計、分類、分發”6個字。通俗的來講,算法推薦就是APP利用大數據科學的給用戶“算命”。

首先,后端系統會通過應用層的注冊信息、用戶點擊行為收集統計所有信息;然后再通過策略層的相關算法對信息進行分類,勾畫用戶畫像;最后策略層再對平臺上的其他信息與用戶畫像相匹配,把結果在應用層呈現到用戶眼中。

這個過程就好比算命,你把生辰八字告訴算命先生,然后算命先生根據生辰八字和相關法則給出你想要的答案。

數據來源:amazon

按觸發條件不同,算法推薦系統目前大致有兩類:

  • 一類是被動觸發的,需要用戶圈定一定限制條件后,系統給你推薦最優解;

  • 另一類是主動觸發,你只要打開APP后系統就會自動給你推薦內容,無需用戶設置條件。

被動觸發的算法推薦中,58同城可當成一個經典案例。58同城是一個集房產、招聘、汽車、家政、本地服務于一體的綜合性網站,這就造成了用戶行為目的的不確定性,僅前面列舉的5項功能就有21種可能,如進入里面的子項其組合可能將會成指數級增長,因此算法推薦對于他們而言的目的是幫助用戶更快找到合適的信息。

例如租房時,58同城會根據用戶的選購條件,例如價格、區位、戶型等在數據層做出統計,然后策略層通過對房源特征分類,將每個特征賦予一個權重,再然后通過用戶數據與房源特征組合形成召回數據,最終召回數據在應用層優先推薦權重高的召回數據,直至與用戶要求完全相違背。

數據來源:《58同城智能推薦系統的演進與實踐》

主動觸發類的算法推薦,頭條系的抖音必須擁有姓名。抖音與58同城的多品類、多層級的復雜信息流不同,抖音的宗旨就是讓信息找人,人就是平臺的流量池。

因此抖音會率先先對用戶上傳的視頻進行統計,然后通過關鍵詞對視頻分類歸入內容流量池,與此同時進行的是系統后臺會對用戶的行為關鍵詞進行統計、分類,勾畫用戶畫像,然后將用戶畫像與視頻流量池的內容相匹配,最終給用戶分發用戶更感興趣的內容,在這個過程中幾乎不需要用戶主動篩選。

02. 算法推薦為何易造成信息牢籠?

《老子》第五十八章言:禍兮,福之所倚;福兮,禍之所伏。前面提到,無論是被動觸發類的算法推薦還是主動觸發類的算法推薦,其主要目的就是減少用戶獲取信息的效率。

例如之前我們看長視頻,要么是按電影、電視劇、綜藝等分類找視頻看,要么就是直接搜索劇名直接觀看,反正要早一個符合自己口味的視頻很是麻煩。而在算法推薦主導的短視頻時代,一直刷一直看已經成為常態。

但算法推薦帶來信息獲取效率提升的同時,也給我們帶入了信息牢籠中。2017年10月10日,又是一個忙碌的周一,《華盛頓郵報》報道了一則讓美國人民無比憤怒的消息,Facebook在美國總統大選期間投放的數千個廣告影響了選舉,甚至還扒出了“通俄門”。

據報道,獲取Facebook 5000萬用戶數據的劍橋數據,利用性格五力模型制作廣告,再通過Facebook的算法推薦最終實現了影響美國大選目的,算法推薦成為了幫兇。

一方面,算法推薦在信息傳播中占據主導地位。

公元前135年,本該在漢使面前宣揚國威的夜郎國國王,且因與漢王朝比大成為千古笑柄,而其原因不僅是因為國王深居宮內信息閉塞,更因為周邊大臣長期推薦“夜郎天下第一”的信息讓國王深信不疑。

從知網《推薦系統》的信息可以直觀的看出,算法推薦就是夜郎國王身邊的大臣,雖然個個都是人才,說話又好聽,但其傳達的信息十分有限,且傳達的信息比較單一,例如你喜歡看搞笑視頻,算法推薦就會在10個視頻中給你推薦7個,剩下的才會拓展其他視頻,這也是為何Facebook會影響總統大選的原因。

另一方面,算法推薦在信息傳播時還具有不穩定性。

算法推薦系統是由程序員設計的一套信息分發系統,說到底還是未逃離機器分發的范疇,就以當前人工智能的發展水平來說,要想鉆算法推薦的空子還是較為容易的。

這樣一來,那些掌握了平臺算法規則的第三方投遞更多挾帶私貨,人們豈不是每天都在垃圾信息的海洋中沖浪?畢竟,現在只要在搜索引擎中輸入某某平臺和算法推薦關鍵詞,就會出現上千萬相關信息助你鉆算法推薦的空子。

03. 算法推薦該走向何方

一千位讀者心中就有一千位哈姆雷特,對待千人千面的算法推薦不同的人也有不同的態度,算法推薦面前,有人吃到紅利對其推崇,有人沉迷其中,還有因幸存者故事將其神化,迷信算法推薦正成為互聯網行業的普遍現象。

但前面提到,算法推薦在信息傳播過程中具有壟斷性與不穩定性,極易對普通用戶造成信息牢籠,那么這樣一個不完美的算法推薦未來會走向何方呢?

其一,算法推薦并行化

并行與串行是數據通訊傳輸的兩種不同方式,據大數據期刊的《信息過載的大數據時代,大數據推薦系統如何搭建,趨勢何方》報告顯示,傳統的算法推薦系統大多采取串行的傳輸方式,這種傳輸方式的好處是適合長距離傳輸,但單次只能傳輸一個數據單元,所以就限制了算法推薦在獲取用戶數據與反饋信息給用戶的數據量,深化了信息牢籠的可能性。

而算法推薦并行化,可以利用并行單次可傳輸多個數據單元的特征,獲取更多信息勾畫更精準的用戶畫像,同時還能反饋更多信息,以足夠的信息降低算法推薦形成信息牢籠的可能性。

其二,算法推薦逐步引入人文社科等新參數。

前面提到,由于機器沒有人的生物性和思想性,當前算法推薦面臨不良信息鉆空子的局面,而造成這種局面的主要原因是因為機器缺少人文情感判定標準。
因此算法推薦未來需要在推薦系統的神經元里要植入“思無邪”和“己所不欲,勿施于人”的節點,協同過濾,最后將更優質的信息反饋給用戶。

打個比方,當用戶在某視頻網站上無意見看到了通過鉆空子進入流量池的“虐貓視頻”,那么沒有人文社科作為新參數的算法推薦則會在流量池中繼續挖掘虐待小動物的視頻,所以除在點擊率、內容標簽、收藏等數學參數外,還因加入人文社科參數。

其實無論算法推薦如何發展,都只是輔助人類獲取信息的調味品,切不要迷信與神話算法推薦,我可不想30年自己成為機器的附庸。

本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本內容為作者獨立觀點,不代表數英立場。
本文禁止轉載,侵權必究。
本文系數英原創,未經允許不得轉載。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 长岭县| 绥芬河市| 莱芜市| 本溪市| 广德县| 吉首市| 双鸭山市| 犍为县| 裕民县| 泽州县| 延川县| 中超| 淮安市| 远安县| 孟津县| 瑞金市| 股票| 遵化市| 罗城| 白水县| 南木林县| 惠东县| 台南市| 建宁县| 子洲县| 琼中| 黄大仙区| 永善县| 永新县| 青阳县| 凤台县| 绥阳县| 泉州市| 麦盖提县| 巩留县| 明光市| 昭平县| 和政县| 曲麻莱县| 台安县| 蒙阴县|