視點 發自 凹非寺 量子位 | 公眾號 QbitAI
今天,盡管人人都在談論大數據,但數據實際價值和現有價值有巨大落差。
(相關資料圖)
盡管企業采集和儲存、計算數據的能力越來越強,但數據分析能力始終增長緩慢。據Forrester調研,約70%的企業數據從未被分析和使用過,成為 數據釋放價值 過程中的卡脖子難題。
過去二十年,世界從PC時代走進移動時代又走到AI時代,生產力工具越來越簡單易用,但數據分析的方式始終沒有本質區別,高使用門檻將企業中的大量數據消費者 (非技術背景的業務人員) 拒之門外。
站在 AIGC時代 的門口,下一個十年,人們應該如何與數據對話?以ChatGPT大語言模型為代表的自然語言人機交互方式,將如何改變我們的工作方式?企業又如何把握這場技術變革浪潮,充分釋放數據的價值,驅動業務增長?
圍繞 AIGC將如何影響數據分析,從而為企業帶來價值 , 北極九章創始人兼CEO劉沂鑫 在「量子位·視點」直播中分享了他的從業經驗和觀點。
以下根據分享內容進行整理:
數據分析或商業智能是件非常古老的事情,跟AI差不多,都是1960年代開始在美國興起。我今天分享的主題是,這個非常具有時代感的事情,怎么在一個新的AIGC時代,通過新技術煥發出不一樣的生機。
先問大家三個很簡單的問題:
第一,在你的企業當中,你覺得數據驅動這件事情到底重不重要?
第二,我的公司或者我的工作,是不是靠數據驅動決策?
如果前兩個問題的答案都是yes的話,最后一個問題更直擊人心:我們投入了這么多的資源,看了這么多的數據,它創造了多少價值?有多少產出?ROI是多少?
這三個問題的核心在于,我們說了這么多年要靠數據來驅動業務發展,那到底數據真正能為我們的企業帶來多大的價值?
哈佛商業評論在2022年對全球最領先企業的采訪中發現,只有26.5%的企業認為自己實現了數據驅動。MIT的調研發現,只有8%的企業真正利用數據提升了利潤。
我們發現,過去50年的時間,即使是全球最領先的企業,數字化轉型帶來的利潤只有這么少。在國內,大家做了很多數據中臺、數據治理和數據準備工作,但沒有通過數據讓企業賺到錢。為什么?
我在美國工作的時候,服務世界頂級的銀行,發現美國企業從上世紀90年開始應用數據的方式方法已經發生了變化,原因在于美國經濟從90年開始年增長率就在大約3%,當經濟增長放緩,企業更看重的是精細運營帶來的數據驅動,從而迅速響應市場的變化。
麥肯錫在2022年1月份發布的報告《2025年做一個數據驅動的企業》指出,在2025年,企業里的每一個員工都會習慣于使用數據來支撐自己的工作,他們會使用創新的數據工具,在短時間內通過數據來解決工作當中的問題?;诖?,領先的企業在2025年通過全新的數據使用方式,CIO以及數據團隊將會從成本部門轉變成為利潤部門。
但一個實際情況是,在疫情之前,中國的經濟以每年約10%的速度增長,企業只要產品可以生產出來,一定可以賣得出去。所以企業經營只要靠經驗來判斷就可以了,數據分析只起到統計作用。企業有平均70%數據從未被分析和使用過。我在跟一個中國領先的汽車企業客戶交流時,他們給我們反饋是大概80%~90%的數據只是存儲,從來沒有被使用過。所以我們也一直在思考,怎么樣可以更好地使用和分析數據,把70%到甚至80%的潛在價值發揮出來。
我們現在在企業里面怎么分析數據呢?
我要從100張看板當中找到某一張看看關心的數據,發現這個數看起來有點問題,就得去提交個工單,數據分析師或IT拉個看板或者導出個Excel表,再對 Excel表進行加工分析??赡艿较聜€月我才知道這個數據的問題在哪里。如果我是賣服裝的,一個月后服裝就已經過季了,數據沒了時效性就已經失去了它的價值。
數據價值的鴻溝是怎么造成的?很大的原因是工具門檻過高。
2002年我們想獲取信息,我會去上新浪、搜狐、雅虎在滿屏的新聞里找我需要的內容;到了今天我們會去Google、百度直接搜索,甚至抖音會自動推薦我感興趣的。20年前我們用筆和紙素描,學攝影和P圖;但今天通過MidJourney、Stable Diffusion,我用一兩句話的描述,就可以生成非常專業的圖片。20年過去,這些工具變得極為簡單。
回到數據分析,我們使用的工具和交互方式和20年前幾乎是一模一樣,我們可能花半年的時間學習一個復雜軟件,學會怎么樣分析數據、怎么樣配圖、怎么樣制作看板。
大家可以想一想,我們工作后會把多長時間花在學習一個新技能上?數據分析本應是很簡單的事情,我每一天只需要看那么幾個數支持做決策就行了,但是我為了每一天看5分鐘,卻需要去花幾個月的時間學習非常復雜的工具。這造成一個很現實的問題,據埃森哲調查,75%的人人不愿意和數據打交道,36%的人在決策的時候會故意繞過數據。
在一個對話式AI時代,只要你能說,你就能做。我們可以大大降低數據門檻,提升大家的數據能力。
大家都知道GPT可以寫代碼,那么數據分析加大語言模型自動寫SQL,作為我的Copilot,變成人和數據之間的翻譯器,可以嗎?
我們做了大量嘗試,發現GPT現階段還不能解決我們剛才提到的問題。我們首先要編寫一段prompt,雖然用的是自然語言,但你依然要按照計算機的方式去跟它交流,prompt越準確,計算機才可以把它翻譯得越好。這導致的幾個問題在于:
第一是門檻高,用戶需要懂數據,并且有分析思路;第二在于容錯率低,需要一個足夠準確、足夠完整的prompt,才能生成一個足夠精確的回答;第三它的套路固定,我們必須要讓每個用戶有結構化的思維,才能有效引導機器來去理解人的意圖。所以這個prompt是有門檻的。
另外我們發現大模型生成的SQL語句,我問它同樣的問題每次代碼不一致,需要人工檢查,我如果不會寫SQL、不知道數據架構,這個代碼我是沒有辦法相信的。如果問題復雜了,它的錯誤率會大大提高。另外,大語言模型沒有辦法去根據用戶的權限自動生成代碼,而且它一次只能回答一個問題,新問題需要再去想另外一個新的prompt,一點一點構造出我的SQL語句。
我們打開思路,是不是可以往前多走幾步,通過自然語言一步直接進行數據洞察?北極九章給出了我們自己的解法。北極九章自研的核心技術生成穩定可解釋的代碼、理解業務需求、保障企業級安全,并且結合了大語言模型的優勢,幫助我們做數據的解讀和決策建議。
我們可以通過自然語言進行提問,用戶不需要了解數據是什么樣子,比如“誰賣的最好”,北極九章DataGPT的語義解析引擎可以理解各種各樣的嵌套問題、模糊問題、補全問題。有了北極九章DataGPT,在整個的數據分析的流程當中,可能打字或語音問問題變成了最長的環節,每個問題都可以在毫秒級時間內獲得答案。
基于我們的Auto Insight自動分析引擎,機器不僅回答你的問題,還主動告訴你這個數據怎么樣、為什么、有什么風險,相當于復制了一個3~5年數據分析師的能力,快速幫你定位問題。如果你不知道該問什么,或者沒找到想要的答案,我們基于推薦算法加人工校準,不斷學習和迭代,讓它越用越好用。
在工作中,我們更習慣在即時通訊工具或在手機上和人溝通。北極九章也可以成為IM的一部分,在企業微信、釘釘、飛書中通過與機器人對話分析數據。我們甚至可以作為WPS插件,在你的任何一個文檔中搜索分析,把圖表插入文檔。我們還有另一個黑科技,如果我周三就把報告寫完了,在周五的時候直接點擊一下更新數據,就能直接更新文檔里的圖表,讓你的報告數據永遠最新最實時。
我們還發現,大語言模型可以解放IT團隊的生產力。原來IT團隊配置數據分析模型是非常耗時和繁瑣的。通過AI的能力,我們可以在一分鐘以內自動化地解析和配置數據。
我們認為,當一個產品足夠簡單、足夠強大的時候,數據可以給每一個人使用。傳統的數據分析軟件使用者太少,數據價值的變現只能是空中樓閣和遙不可及的存在。
我們服務了國內最大的保險經紀公司之一,這個公司有上千號人,投入了大量精力建設數據中臺,但是他們發現,業務人員在上中臺之前大概需要一到兩個月的時間獲得一個數據看板,上中臺之后還是需要一兩個月的時間,數據中臺的建設成果,其實并沒有被業務人員感受到。
使用了北極九章之后,業務人員直接使用搜索的方式,立刻就可以通過數據定位到哪些保險產品在哪些子公司理賠周期過長或者過短,相當于為整個團隊帶來了超過40個人的額外分析能力,每年節約超過1000多萬元的機會成本。讓我們感到非常欣喜的是,這個公司之前很多的決策都是靠拍腦門,現在業務人員會主動想決策之前是不是可以先搜索問問數據。
不久前Gartner發布了2023年數據分析的十大關鍵技術。2023年,企業會部署的新興技術包括增強數據和分析、自然語言處理和決策智能;會話式用戶界面、自然語言生成、Transformer模型和大規模預訓練語言模型預計也將會全面應用于企業??梢钥吹剑澜缱铑I先的企業都在尋求通過數據和分析帶來可量化的價值,構建信任培養數據和分析文化。
過去的幾十年,我們在數據建設方面雖然有了長足的進步,但是我們的數據其實大而不強,相比于歐美領先國家,仍有至少十年的差距。當AIGC趨勢到來的時候,我們的企業如何去布局未來十年?如何在激烈的競爭中贏得優勢?
可以確定的是,我們沒有時間像過去一樣慢慢培養專業人才、組建團隊。未來的十年,人和機器直接對話會成為趨勢,我們的工作將不會是不停操作Excel和看板,而是通過我們最習慣、最自然的溝通方式,在AI的幫助下隨時問出問題。
量子位發起的CEO/CTO系列分享活動,不定期邀請前沿科技領域創業公司CEO/CTO,分享企業最新戰略、最新技術、最新產品,與廣大從業者、愛好者探討前沿技術理論與產業實踐。歡迎大家多多關注 ~
需要觀看直播回放的小伙伴,可以戳鏈接噢: https://www.bilibili.com/video/BV1VM4y1t7SK
— 完 —
標簽: