
新聞資訊
News and information
-
24
12/06
AI編程在硅谷殺瘋了,但國內還長得出自己的Cursor么
出路在哪里。2024年夏天,經歷了3次重大功能更新和40余次功能迭代之后,AI代碼編輯器Cursor在北美制造了一場程序員狂潮,并且也隨即成為大洋彼岸中國程序員們的編程工具首選。面對強大的GitHubCopilot,Cursor帶來的交互方式的變化、使用體感上的創新、對整個程序文件全局補全代碼的能力、雖由OpenAI孵化但基座模型棄GPT4而選Claude的決策、快速拿下3000名各領域客戶的成績、以及早在8月就達到的4億美元估值,都讓它成為科技圈熱議的焦點。Cursor甚至都不是硅谷第一個走紅的AI編程產品,更不是最后一個。今年3月,“AI程序員”Devin引發行業廣泛關注,僅5個月后,另一家名為Cosine的AI初創宣稱,他們全新推出的AI程序員Genie測試表現遠超Devin,8月,集成了AI的強化型代碼編輯器Cursor迅速成為頂流,作為VSCode的衍生版本,它在繼承VSCode優勢的基礎上,全面融入AI功能,極大簡化了軟件開發工作流和編程過程,在它之后,Magic、Bolt、Replit、Supermaven紛紛成為AI編程明星公司的代表,他們各自擅長不同的方向,Supermaven重上下文本長度,Bolt、Replit在工作流上做了更多延展,不僅能設計代碼的整體結構,還能夠對代碼作出全局修改,甚至超出了Cursor的能力邊界。據報道,這些公司的總融資額早已超過了22億美元。AI編程在硅谷逐漸成為最性感的AI賽道,10余家今年活躍的AI編程初創中,已有7家成長為獨角獸。然而,與很多領域的“追逐”不同,在AI編程公司席卷硅谷的同時,國內卻基本上沒有聽到過AI編程初創公司的大消息。一位前沿科技領域主流VC的投資人告訴硅星人,其實國內去年一下子也冒出了多家AI編程公司,他們當時梳理完曾經有十四五家。“那些創業團隊都在編程賽道上想各樣東西,比如代碼搜索,比如面對論文進行編程,比如做代碼注釋,或者代碼修復,還有一部分在做純代碼生成,完全對標Cursor。”他稱。“但問題是,水平差了很多。”他形容,總體而言這些團隊做得代碼生成,程度不深。硅星人了解到,去年奇績創壇投了六家AI編程領域的初創,此后幾乎全軍覆沒,而去年10余家曾短暫浮出水面的代碼類團隊,今年大部分已經退場。對標Cursor,現實骨感“水平差了很多”的問題,其實是個AI行業常見的問題。在基礎模型上,在Chat類的AI應用上,其實都存在中國公司追趕美國對手的現狀,但事實上這些賽道還是有融資發生,投資人也能在市場邏輯上自洽。但AI編程有一個很大不同,就是——面向開發者的AI編程產品沒有國界。這與那些面向企業的知識庫問答助手等產品都并不一樣,因為語言、生態等方面的差別,中國和美國差異很大。據硅星人了解,面向企業的知識庫問答助手,面向中國和美國客戶,面向中文與英文的版本差異堪稱巨大。“美國先做出了好產品,國內開發者都會去用,沒有太多門檻”。來也科技CTO胡一川指出。于是,水平做得太淺在AI編程的賽道上,就成了第一個問題。達不到Cursor、Bolt、Magic等新貴的身位,這個硬標準如果不能啟及,在許多中國投資人眼里,再好的團隊也不能吸引到投資。有AI應用團隊聯合創始人表示,海外市場目前很多類似Cursor的明星產品跑出,本質上是美國資本市場對這類——用海外最好的大模型(Cursor用的是Claude)直接做插件,做成Agent的編程產品非常buyin。客觀而言,在模型層面,國內似乎不缺乏比肩GPT4的模型,然而問題似乎不在這里。因為哪怕是同樣基于海外模型,目前很多應用的產品完成度和能力都依然欠缺。于是,當國內投資人看AI編程賽道的一個共同邏輯是對標Cursor時,就自然下不了手。上文提到的AI應用創業者表示,他經歷過幾十次非常類似的交談,但發現投資人們最終認為,“這個標準國內產品是達不到的”。“現階段在海外能解決這種IDE生態問題的中國團隊尚且看不到。”AIGCodeCEO宿文表示。IDE指的是集成開發環境,指用于提供程序開發環境的應用程序,包括代碼編輯器、編譯器、調試器和圖形用戶界面等工具,如微軟VS系列問題。他認為,目前中國公司們哪怕想在海外實現Cursor這樣的“插件邏輯”,也是遙遙無期。當在技術本身落后時,中國投資人過往的一個常見邏輯是,我們有更大的市場和應用場景,商業化上可以快速跑起來,進而帶來應用上的彎道超車機會。然而在AI編程上,商業化的環境也沒有比海外好到哪去。“投它(AI編程)就是因為其賺錢。”常駐硅谷的AminoCapital合伙人徐霄羽表示,AI編程火爆于硅谷,背后原因是PLG(產品驅動增長)SaaS模式在整個海外是成立的。徐霄羽發現,她們機構最近3年投資的初創公司,發現并找到PMF的生成式AI公司,比沒有生成式AI驅動的公司能節省一半時間達到1000萬美金ARR(年度經常性收入),這雖然不能幫助這些公司日后成為谷歌,但足夠發展成一個小獨角獸體量,其中最典型的例子就是2016年成立,今年躍升成為編程界新貴的Replit。但事實上,哪怕在硅谷當紅編程工具如GithubCopilot、Cursor和Bolt,在現實中的產品狀態也沒有達到強付費點。構建自有編程模型的另一家新貴Magic,甚至都沒有發布正式可用產品,他們仍解決存量場景下的存量程序員需求。國內的付費道路更在最早期。國內2BSaaS生態因利潤率低不賺錢,因復雜環境成因不起勢已是老生常談,就連李開復日前都說“現在還沒有SaaS訂閱的妄念”。而且,AI編程很重要的目標群體是互聯網公司的程序員們,但大廠傾向于團隊自己做生產工具。公開信息顯示,阿里云、字節跳動、華為、百度內部都有成熟的AI編程業務,這些業務服務于內部,讓外部的創業公司少了很多市場機會,同時這些業務在市場成熟的時候也很可能轉身入局,對外提供服務,像當年釘釘與飛書的歷程一樣,屆時創業公司的空間也會進一步被碾壓。尋找出路:有人找獨特的市場機會,有人認為還是要硬碰硬劉罡是國內最早關注AI+行業方向的風險投資人之一,依循阿爾法公社的“投人不投賽道”的邏輯,作為合伙人的他很早走訪到幾家很有潛力的AI編程團隊,包括其中一家編程方向的項目,團隊資質良好,有不錯的產品,項目針對B端企業和開發者,但付費很成問題,他們曾找到少數大B客戶做私有化部署,但總體“說白了收不上錢”,勉強維持但無法實現快速發展。這一團隊于2023年下半年陷入困局,今年伊始,他們堅決轉型進入全新領域,開始有了一些不錯的營收和業務增量。北京大學長聘教授李戈耶是國內這一賽道最早的闖關人。兩年前他創立了aiXcoder,早于ChatGPT問世之前,李戈用比較傳統的編程方法孵化這一項目,在IDE(集成開發環境)里做插件,做代碼補齊,有些類似經典的知識圖譜。2023年起,aiXcoder調轉船頭擁抱大模型,做大B端和2G端生意,接連獲得了幾家銀行和國企商單,年中預測今年會有6000萬左右的營收,和近10億人民幣左右的市面估值。還有高瓴、清流資本和一家汽車產業鏈基金的加注。“這是中國特有的機會,國內有很多大型公司,自己有比較大的開發團隊,它們需要AI編程的輔助,但又不可能用GitHubCopilot或者Cursor這樣需要連接云端大模型的產品。“胡一川認為。當下國內絕大部分頭部銀行、保險公司、和金融行業里的大型企業,都擁有異常龐大的開發團隊,小則幾千,大則上萬,他們的共性是希望運用先進的AI工具和技術,但不太可能使用互聯網上的編程工具,出于安全考慮,必須使用一款能在環境里做本地化部署的AI編程整工具。這不僅是AI編程一個賽道的特性,還折射出整個大模型ToB落地的新趨勢。胡一川認為,目前很多客戶要的不僅僅是你的模型本身,或者AI編程軟件,要的是軟硬一體化的方案,“要這個東西做本地化部署,需要選擇什么樣的GPU,怎么在GPU上做訓練和推理,怎么高效使用GPU,都需要廠商具備很專業的服務能力。”總之,“AIcoding這里面的角色從設計到開發到測試到發布都有,新的公司想繼續走這條路,競爭是非常激烈的,除非他找到了一個非常獨特的群體,或者非常垂直的領域,一些通用的產品解決不了的問題,它能夠解決,才可能會有機會。”胡一川說。這的確是一種生存思路。最近原月之暗面視頻生成產品Noisee負責人明超平離職,他創業的項目也是一家AI編程公司,據硅星人了解,這家公司是走輕量級類似Websim的產品路線,瞄準游戲等場景,(Websim是款僅通過文字描述就可以生成網站的網站,可以生成小游戲和一段音樂,由OpenAI、Anthropic等大模型驅動,如Claude3.5Sonnet和GPT-4o),暫時沒有自己的專屬模型,要走比Bolt還輕的產品付費路線。與此同時,還是有新的創業者“不信邪”,認為最終的出路還是要與海外最強的產品“硬碰硬”,在能力和模式上通過創新來獲取自己的機會。AIGCode的宿文是其中一員。他表示,一些AI編程國內企業做的大量工作是代碼測試和代碼修復,這都只是進入到了編程賽道,但不算真正在做深度代碼生成。“這個真正的工作像吃肉,需要放棄邊角料”。他此前在華創資本做投資人。2021年3月離開華創之后,保留了投資合伙人的身份,但幾乎是全職投入了創業模式,最終他在今年1月創立AI編程公司AIGCode,獲得了兩輪融資AIGCode的產品是一個端到端的Autopilot工具,有自己“pre-trainfromscratch”的通用模型,想對標poolside、magic,做大模型時代的產品發動機。宿文告訴硅星人,他把端到端做代碼生成定為自己20多人團隊的工作方向。“20多人搞不定的事兒,200個人也搞不定,這個賽道的技術人才是非常有限的,有幾個人做過預訓練又有多少人做過先進且創新的軟件架構呢?”20人的規模與他對標的競爭對手,美國AI編程初創Magic的體量相當。從模型和軟件架構上去做代碼生成,做端到端完成任務的編程工具,并訓出自己的模型,與應用垂直結合,最終接管APP工廠里的多個職能,這種端到端完成任務的編程方式,是宿文眼中在編程領域能脫穎而出的唯一方法。在鏈路管線上分工明確的硅谷,端到端沒有必要,但在中國的開發與B端環境里,端到端可能是更符合市場需求的模式。“只有端到端的代碼生成或者片段化的代碼補齊叫做AI編程”。但這也要求你真的可以做得比硅谷新貴們流程全,做得水平比他們還好。這顯然并不容易,和其他同行一樣,市場和投資人給他的時間窗口也是有限的。一切都需要加速進行。宿文表示,自己的團隊已經把很多先驗性東西跑完,目前處于往產品上補全功能覆蓋度的階段,并于最近開啟了產品內測。“付費點沒到之前,最好的辦法是先讓用戶起來,讓產品出來,這個賽道就像南北坡爬山,Copilot已經從北坡先爬到了大本營,我們在南坡還不一樣,但大家最終都能登頂。“宿文說。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
12/06
OpenAI進軍瀏覽器,AI正在消滅“網頁”,瀏覽器怎么活?
物競天擇,適者生存。ChatGPT之后,AI改造軟件就迅速成為了全球的共識,「人工智能將從根本上改變每個軟件類別,」正如微軟CEO薩蒂亞·納德拉所言,而瀏覽器作為最重要的軟件之一當然也在其中。甚至,OpenAI可能也要來了。TheInformation在最新報道中就披露,OpenAI打算開發一款自己的瀏覽器(Browser),來與Google旗下的Chrome硬碰硬。坦白講,這條新聞并不讓人意外,考慮到OpenAI已經推出了ChatGPTSearch,還有獨立客戶端(Windows/macOS),就算推出瀏覽器也是順理成章的一件事。圖/OpenAI問題是OpenAI要打造一款什么樣的瀏覽器?是和大家一樣基于Chromium,還是基于自家的ChatGPT客戶端?是傳統意義上的網頁瀏覽器,還是基于AI問答的全新瀏覽器?目前來看,短時間內我們還很難期待OpenAI正式推出自家的瀏覽器,也得不到上述問題的答案。但不管如何,瀏覽器很重要,時至今日依然是無數人通過互聯網看世界的重要窗口,尤其在PC更是最重要的窗口,沒有之一。瀏覽器的AI化,自然也是題中應有之義。(編者注:本文提及的AI化,主要代指ChatGPT之后以大模型為基礎的生成式AI化)AI瀏覽器,才走出第一步作為一種產品,瀏覽器完全稱得上「古老」,基本伴隨了整個互聯網行業的成長過程,從網景和IE瀏覽器的王朝更替,到Chrome和Firefox的雙子星崛起,再到今天以Chrome為首的一超多強。但與之相對,AI瀏覽器還只能說是「初生牛犢」。今年1月微軟Edge在主流瀏覽器中率先打出了「AI瀏覽器」的口號;隨后的3月,360創始人周鴻祎也在一場直播中發布了號稱AI化升級的360AI搜索和360AI瀏覽器。圖/360不只是Edge和360,今年以來AI化已經成了瀏覽器的共識。就連一向步驟緩慢的Chrome也沒有按耐住AI化的步子,由主導開發Chrome的現GoogleCEO桑達爾·皮查伊在年初宣布引入生成式AI能力。AI化的瀏覽器帶來了體驗上質的升級嗎?很可惜,還沒有。目前來看,大部分所謂「AI化」的效果基本等同于按照一個AI功能插件的效果,以側邊欄、懸浮窗為形式,以網頁總結、AI聊天、AI生成文本/圖片等功能為主。不能說這些功能沒用,但實際帶來的體驗升級有限,與瀏覽器的結合也不夠深入,完全可以通過安裝一個ChatGPT插件、豆包插件、Kimi插件來實現。圖/夸克而另一方面,瀏覽器上變化最大的AI搜索,實質上更接近一個獨立的產品和服務,脫離瀏覽器也完全服務用戶,所以這里先按下不表。當然瀏覽器的AI化也不全如此,比如Chrome年初宣布引入的生成式AI能力中,就專門提到了「標簽管理」的AI化,可以運用生成式AI的能力將所有標簽頁進行智能分組。包括新創瀏覽器公司TheBrowserCompany,在2月發布的「第二幕」(ActII)更新中甚至為Arc更早加入了類似功能,一鍵就能用AI組織標簽頁——根據網頁內容自動分門別類并且重命名。此外,作為AI化可能最激進的瀏覽器,Arc還利用AI實現了搜索直達、書簽和下載文件的智能重命名等。但這是少數,大部分瀏覽器的AI化還停留在表面上,更多還是營銷考慮以及FOMO(害怕錯過)心態帶來的動作。另一方面,瀏覽器廠商還在進行各種探索和嘗試,這些都是需要時間的。不過有一個問題卻是瀏覽器需要共同面對的:如果Web再死一次,瀏覽器要往哪走?AI正在徹底殺死Web2010年,克里斯·安德森(ChrisAnderson)在《連線》雜志上發表了一篇影響深遠的文章——《Web已死,Internet永生》,其中最核心的觀點就是App對于網頁的大規模沖擊。2010年前后,在從桌面設備(PC)轉向移動設備(手機)的過程中,互聯網用戶的內容消費習慣已經呈現出現了明顯App化的趨勢,開始慢慢習慣用一個個App而非通過一個瀏覽器瀏覽不同Web。不過后來的事實證明,Web確實受到了App很大的沖擊,但依然有相當部分的消費者使用瀏覽器瀏覽網頁,尤其是在PC上依然堅挺。另外,還有不少瀏覽器延伸出了小說閱讀、資訊等服務,來吸引和留住用戶。但如果說瀏覽器的本質是瀏覽網頁,那當用戶不需要瀏覽網頁的時候,還會需要瀏覽器嗎?圖/夸克這是生成式AI時代面對的一種可能,關鍵變化在于AI搜索正在直接生成答案,而不是引導用戶跳轉鏈接去到一個又一個的網頁。簡言之,如果越來越多用戶滿足于AI搜索生成的回答,沒有必要瀏覽一個個網頁,傳統瀏覽器關于標簽頁、書簽、擴展程序以及關于網頁瀏覽的大部分設計、功能慢慢也就沒有了用武之地,「瀏覽器」這類產品自然會逐漸失去本身的意義。如何面對這種可能?不同玩家有不同的答案。AI正在讓瀏覽器「脫胎換骨」10月,Arc瀏覽器開發商TheBrowserCompany宣布了一個大新聞——停止Arc瀏覽器后續的功能更新,未來只會進行基本的穩定性維護。與之相對的是,他們將啟動一個全新的項目,CEOJoshMiller坦言:「說實話,我們甚至不確定它能不能稱得上是一個網絡瀏覽器。」圖/TheBrowserCompany唯一肯定的是,新項目依然聚焦網絡瀏覽,但卻是從頭開始基于大模型驅動,而非像Arc一樣「半路出家」。至于新品到底是類似ArcSearch(移動端)的AI搜索,還是基于問答的全新形態,還要拭目以待。總之按照規劃,這家集齊Chrome創始成員、Safari前首席設計師的新創公司將于明年春季發布這款全新的「瀏覽產品」(姑且稱之)。不過相比推倒重來,更多廠商不太可能放棄已有的品牌認知,也不想太過挑戰用戶的習慣。但即便是在原有瀏覽器產品形態的基礎上進行改良,不同瀏覽器廠商的判斷、能力也有所不同,帶來的結果和體驗也會有很大的差異。一個核心是大模型。相比大部分廠商沒有大模型自研能力,只能選擇接入第三方大模型,少部分廠商如夸克、豆包、Kimi擁有自研大模型,有利于實現從底層大模型到應用層的垂直整合,并且根據AI技術的進展、用戶數據和反饋快速地進行產品迭代。同時夸克、豆包以及Kimi這三家,在桌面端產品上都不約而同將「AI搜索」——現階段可能是AI改造最重要的軟件類別,視為核心。但除此之外,夸克或許是沉淀了更多產品經驗和對用戶需求的了解,沒有局限于AI搜索以及網頁總結等主流AI功能,還集成了一整套信息處理和生產的AI工具,包括AIPPT、AI簡歷、AI搜題等。圖/夸克寫在最后時間臨近2024年的年尾,AI改變世界的進程仍然存在不少不確定性。包括OpenAI聯合創始人、前首席科學家IlyaSutskever在內,一批頂級AI技術專家看來,基礎大模型的智能涌現已經碰到了瓶頸。但盡管如此,AI對于瀏覽器的影響已經不言而喻,幾乎所有還在更新維護的瀏覽器產品,都在圍繞AI加入新的功能甚至交互設計,甚至重新改造搜索的體驗、獲取和處理信息的體驗。正如達爾文在《演化論》中反復論證的觀點——「物競天擇,適者生存」,AI正在底層改變我們獲取信息、處理信息甚至生產信息的方式,而作為我們通過互聯網獲取信息最重要的窗口之一,瀏覽器必須適應時代的變化、重新改造,才可能不被用戶拋棄。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
讓AI“上天”“入地” 大模型如何打開未來世界
將大模型和生成式AI送到普通人手里,讓大模型觸手可得。從ChatGPT問世至今,已經過去2年。大模型和生成式AI帶給人們的,除了無限暢想,還有理想與現實的差距。即便AI手機、AIPC、AI汽車相繼問世;即便隨便打開一個大模型,讓AI搜集一些資料、擴展一篇文章,已經“SoEasy”,但大多數人仍覺得“不解渴”。用一句話總結,人民群眾日益增長的AI理想與AI現實之間存在巨大矛盾。那么,如果從專業角度,該如何評價過去兩年大模型和生成式AI的發展?“AI先生”李彥宏11月12日做了總結:“大模型最大的變化是基本消除了幻覺,回答問題的準確性大大地提升,變得可用、可被信賴。”同時,他認為智能體是AI應用的最主流形態,即將迎來爆發點。消除幻覺的一個標志性產品是百度自研的iRAG,將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,沒有了幻覺,少了AI味兒。比如車企可以用iRAG生成宣傳海報,還原真實的車型,再也不用畫幾十萬去拍攝了。再比如馬斯克在故宮旅游,不僅馬斯克和故宮都能精準呈現,還能將人與場景非常自然地融合在一起。作為國內大模型和生成式AI參與國際競爭的種子選手,百度在AI領域的進展值得關注。11月12日的百度世界大會上,李彥宏就重點介紹了百度大模型和生成式AI的當下進展以及未來空間。陡峭增長,日調用量超15億北京上班的小徐,最近嘗到了AI的甜頭。因公司設計人員不多,且集中精力備戰雙十一,給領導做PPT的任務就落在他頭上。可他只擅長文字工作,制作PPT是短板,心里犯怵。經同事點撥,他知道了百度文庫可以一鍵生成PPT,將發言稿全文上傳后,就能生成個七七八八,再更換下配圖、調整下文字圖片大小即可。這可幫了他大忙,接到領導這樣的任務,他再也不擔心了。百度文庫的一鍵生成PPT功能背后正是百度文心大模型在發揮作用,小徐的每次使用,都需要調用一次大模型。除了制作PPT,用戶每一次在百度App搜索智能體,每一次在文心一言問答,每一次用文心一言生成圖文都會調用文心大模型。除了C端用戶,B端企業用戶的數字人、智能客服等每一次服務用戶,也都會調用一次文心大模型。這個調用量規模有多大呢?李彥宏透露,截至11月初,百度文心大模型的日均調用量超15億。這足以表明大模型已經深入用戶日常生活。更值得關注的是,日調用量增長的速度。李彥宏表示,百度內部曾討論大模型的未來,“怎么才叫成了”。他當時說,如果文心一言大模型日均API調用量,一年之內漲10倍,從今年5月初的2億到明年5月漲到20億,就認為成了。因為這說明,大家是真的需要。而目前,僅半年過去,就超過15億,逼近20億,這條超出百度預期的陡峭增長曲線,正是中國大模型應用大爆發的縮影。此外,文心一言用戶規模達到4.3億。AI從量變迎來了質量時刻。AI需求側的爆發式增長,離不開供給側的持續迭代。比如,百度研發了“理解—檢索—生成”協同優化的檢索增強技術。檢索增強是大模型去幻覺,增強答案可靠性的主要路徑,即用海量搜索信息指導內容生產,提高準確度。再比如,服務程序員的智能代碼助手文心快碼升級至3.0版本,不僅功能開發、代碼測試、問題修復等能力有所提升,還能實現多個智能體流水線協同,進一步提升程序員工作成效。面向產業端,百度構建了文心大模型矩陣,包括ERNIE4.0Turbo等旗艦大模型、ERNIESpeed等輕量模型,以及基于基礎模型生產的系列思考模型和場景模型,滿足不同應用的需要。當然,這更離不開百度AI先人一步出發。ALLinAI到李彥宏獲評AI先生,百度幾乎是國內唯一持續多年在AI領域做投入、開源、人才培養、生態共建的企業。10多年來,百度為人工智能和自動駕駛研發投入超過1700億,聘請2024物理諾獎得主辛頓、吳恩達、DarioAmodei等全球科技領軍人物,使得百度在大模型領域成為真正的扛旗者。打開多個增長通道AI正在重塑百度。除了大眾知道的百度將旗下產品全部AI化以外,文心大模型還在至少三個維度為百度提供新的增長動力,由內到外改變這家公司。一是智能體。這被李彥宏看作是AI原生時代,融合內容、信息、服務的新載體,類似PC時代的官網,移動時代的自媒體賬號。與智能體緊密相關的是百度的搜索業務,以前用戶百度搜索之后的結果頁是官網或者其他SEO之后的內容,如今得到的更大概率會是智能體。有何區別呢?以往,用戶在百度App搜索比亞迪,通過首個結果進入比亞迪官網,自主瀏覽、查看。現在,搜索結果第一條是比亞迪智能體,變成了一個類似生成式AI的互動界面。用戶可以問某款車型信息,多款車型對比,或者線下門店信息等,智能體可第一時間生成答案,告知用戶。這種模式下,品牌與用戶的鏈接更精準、高效。在百度看來,搜索是智能體最大分發入口,智能體的爆發會使搜索成為AI時代的第一入口。數據顯示,截至2024年11月,百度文心智能體平臺已經吸引了15萬家企業、80萬名開發者入駐。越來越多的智能體出現,將徹底改變原有的搜索體驗,為百度賴以起家的搜索業務帶來新的合作模式、盈利模式,打開新的增長通道。二是百度智能云。近幾個季度,百度智能云營收增長強勁、持續盈利,正是與大模型綁定的結果。因為大模型,解決了企業客戶在AI時代的需求,帶動了模型構建、算力消耗、接口調用等需求,并幫助企業客戶催生了AI原生應用。最初,云服務是解決企業客戶信息化、數字化的成本問題、效率問題,更多屬于CTO決策的范疇。后來,各個云服務廠商增加了行業解決方案,將云服務深入到企業經營管理各方面,涵蓋了生產、銷售、服務、管理等多個環節,幫助CEO解決問題。在AI原生時代,企業客戶迫切需要借助大模型工具,實現自身業務的重構。文心大模型與百度智能云結合,讓企業客戶應用AI、大模型的門檻降低,不僅僅是成本,還包括人員組織等多維度。為實現這一步,百度在文心大模型旗艦版的3.5和4.0版本基礎上,推出了5款輕量級/特定模型、AI原生應用開發工具AppBuilder等,幫助企業更低門檻、更高性價比的進入AI原生時代。目前。百度智能云千帆大模型平臺已幫助客戶精調了3.3萬個模型、開發了77萬個企業應用。百度智能云也成為中國最大的大模型產業落地云,60%以上的央企,以及大量的民營企業,都在聯合百度智能云進行AI創新。三是自動駕駛。自動駕駛是百度面向未來,需要長期培養的增長點。在大模型的加持下,百度自動駕駛技術迭代更快,商業空間更大。今年,百度Apollo發布了支持L4級自動駕駛的大模型ApolloADFM(AutonomousDrivingFoundationModel),可以兼顧技術的安全性和泛化性,做到安全性高于人類駕駛員10倍以上,實現城市級全域復雜場景落地。門檻越低,商業版圖越大縱觀百度大模型近兩年發展,明顯朝著“上天”“入地”兩個方向發展。“上天”是不斷優化大模型技術,持續迭代,提高競爭壁壘。不論從專利數量還是應用規模,百度在大模型領域都走在全球第一梯隊。前不久,沙利文發布的《2024年全球AI生態全景概覽》中,百度與谷歌、OpenAI等位于AI-NativeGiant(AI巨頭)同一序列。“入地”是百度在不斷降低大模型應用成本和門檻,讓更多人觸手可及。除了各種開放平臺、開發工具,百度還親自下場,為高校、企業培養了數百萬的AI人才,讓AI普及的速度越來越快。本次百度世界大會再次體現了這兩點。李彥宏在會上發布了兩項新技術。一是iRAG技術。回顧過去兩年,李彥宏認為,文字層面的RAG(檢索增強生產)已經做得很好基本讓大模型消除了幻覺,即用戶跟大模型一問一答,大概率能得到用戶想要的答案。但在圖像等多模態方面,還存在較大幻覺,比如讓大模型生成一張某歷史人物在某景點的照片,還是存在“一眼假”的情況。要么是事實性錯誤,如人物張冠李戴,要么是畫質“機器味兒”太重,缺乏真實感。?針對于此,百度開發了檢索增強的文生圖技術iRAG(imagebasedRAG),將百度搜索的億級圖片資源跟基礎模型能力相結合,可生成超真實的圖片。這項技術擁有廣泛應用場景,比如過往汽車品牌要拍一組海報大片,動輒要大幾十萬,應用百度iRAG,可立刻生成,且成本幾乎等于零。這是百度不斷“上天”,向技術高峰攀爬的行動。當天,李彥宏還重點介紹了計劃明年一季度上線的無代碼工具“秒噠”,是百度不斷降低大模型門檻,“入地”的體現。“秒噠”可以說,滿足了大多數人對于大模型和生成式AI應用的想象,即不需要懂編程,只需要說出想法,AI就能實現和生產所需要的應用。具體如何實現?用戶只需對準秒噠用中文描述需求,如需要搭建一場活動的在線報名系統,并上傳活動時間、地點等信息。之后,秒噠會自動調取多個智能體、多個工具,實現程序的開發、BUG檢查、視覺設計等工作,完成報名系統的開發。也就是說,只要有想法,你就可以心想事成,這也將迎來一個前所未有的只靠想法就能賺錢的時代——點子時代。當一個復雜的事務變得簡單化,將是其走向千家萬戶,占領大眾市場的開始。比如微軟的可視化桌面系統取代Dos系統,讓普通人可以使用原本復雜的計算機。而“秒噠”的落地,意味著將開啟一個全新的點子時代,這才是AI真正的價值所在。“秒噠”正是這樣一個工具,讓每個人都變成程序員,將極大提高AI原生應用的生成效率,帶來更多智能體,進一步繁榮AI生態。而百度作為這一生態的主要創建者,未來的獲益無需多言。【結束語】作為全世界最成功的快消品之一,可口可樂的成功有其獨特配方、成功的營銷,還有重要的一條,即建立了全球最大的飲料分銷系統。2019年其已在200多個國家建立超30000萬個銷售網點,覆蓋了全球約60%的零售店。這樣的結局是,世界各地的人們觸手可得可口可樂。當前的百度正在做類似的事情,將大模型和生成式AI送到普通人手里,讓大模型觸手可得。AI的普及和商業化自此打開,百度更廣闊的未來世界也被打開。本文來源:R艾瑞網文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
低代碼賦能企業數字化轉型:數百家軟件公司的成功實踐
在當今的軟件開發時代,以新技術助力企業數字化轉型已經成為一個熱門話題。如何快速適應技術變革,構建符合時代需求的技術能力和業務模式,成為了軟件公司必須面對的課題。在這個背景下,低代碼技術是如何賦能軟件公司,助力軟件公司實現業務騰飛?本文將從低代碼時代軟件公司面臨的機遇與挑戰入手,分享低代碼轉型的最佳實踐:確定轉型戰略、探索轉型路徑以及打造組織能力,助力軟件公司實現破局。低代碼產業高速發展過去五年來,低代碼開發成為軟件開發技術的一個熱門領域。IDC、中國信通院、艾瑞咨詢、低碼時代、愛分析等眾多國內外研究機構對這個領域非常關注,發布了近百份研究報告。根據這些報告對低代碼發展趨勢的預測,2023年到2025年中國低代碼產業的增速在35%-65%之間,是中國軟件產業增長速度的3到5倍,低代碼技術正在進入應用普及階段。企業對低代碼技術的實際需求驗證了專業機構的預測。我們分析了國內中大型組織在招標中提出對“低代碼技術”的需求,根據國內五家重點招投標網站上發布的信息,從2022年到2023年共有411條(去重后)與低代碼相關的招投標記錄,金額普遍在50萬以上,僅僅這些企業在低代碼上的投資就已經達到了數億元規模。同時,從時間維度看,低代碼需求呈現顯著的增長趨勢,從2022年上半年到2023年下半年,招投標的數量增長了8倍。(越來越多中大型企業采購“低代碼平臺”進行應用構建)開發者對于低代碼技術的關注度如何呢?我們選取了搜索指數這個維度進行研究。從2019年至2023年,低代碼技術的搜索指數從初始的0搜索量,增長到熱門技術JavaScript搜索量的25%,這表明低代碼技術已經成為開發者關注的一個熱門話題。(“低代碼”一詞的搜索指數與JavaScript相比較)行業專家、企業用戶以及開發者紛紛將目光聚集于低代碼技術,顯示了低代碼技術的巨大發展前景,也預示著低代碼將在未來三到五年加速普及,我們正在迎來“低代碼時代”。低代碼給軟件公司帶來的新機遇當前,超過95%的應用軟件是以編碼為主進行開發的,一個中等規模的應用,前期需要投入數百萬的成本。在應用構建完成之后,還需要通過市場的打磨和修正,才有可能贏得第一批用戶,后續還會面臨企業用戶復雜多變的個性化需求。在此過程中,軟件公司不但要投入巨大的資金和人力成本,還會面臨很大的風險。低代碼技術的出現能夠有效緩解上述壓力。與傳統開發方式相比,低代碼技術具有更高的效率和更低的學習曲線,使得企業能夠更快地推出新的軟件產品和解決方案,并通過敏捷迭代、快速試錯的方式,快速響應市場變化。針對定制化和二開需求,低代碼技術能夠提供強大的集成和開放能力,結合拖拉拽等可視化開發的方式與業務人員共同協助,幫助實現貼合業務需求的軟件應用。對軟件公司而言,低代碼技術能夠帶來顯著的價值:1.低代碼提供先進生產力,幫助軟件公司提升利潤傳統開發模式下,人力成本居高不下,利潤空間有限。采用低代碼技術,可以大幅降低開發成本、工具采購成本和培訓成本,為軟件公司帶來了新的利潤空間。(先進的生產工具帶來先進的生產力)以上海格心科技有限公司為例,其使用低代碼為寧波愛健軸承搭建了一整套運營管理平臺——“智造云”平臺。該系統從產品設計、生產裝備數字化、生產過程管理、倉儲物流、能源利用等多個模塊展開,實現了對智能工廠的全面覆蓋。整個系統的開發工作量,僅為傳統代碼開發的1/4。系統上線之后,愛健軸承的生產效率提升了30%、生產成本降低了20%、產品不良率降低了28%、能源利用率提升了11%,產品研發周期也縮短了37%。憑借該系統,愛健軸承成功入選“浙江省第二批智能工廠認定名單”,并榮獲全球領先的IT市場研究和咨詢公司IDC所頒發的FutureEnterpriseAwards未來運營領軍者。2.幫助軟件公司深度服務于企業數字化需求,促進業務發展傳統的信息化建設通常以外包、外采的方式為主,在框架、主數據和應用創新上都有明顯不足。如今,面對激烈的市場競爭環境,企業對數字化應用的深度和廣度都提出了更高的需求。企業更加注重統一平臺的建設,希望實現更高效的數字化轉型。同時,企業對自主開發和可控性的需求增加,渴望能夠自主構建數字化基座,并能夠自主決策未來數字化發展的方向。在新的形勢下,軟件公司不能繼續滿足于只為甲方企業進行項目交付,而應該更深度地服務于企業數字化需求。對于有意引入低代碼的企業,軟件公司可以從多個方面更好地服務客戶:·推動低代碼立項,幫助客戶準確分析企業現狀、明確項目目標和制定選型評估計劃;·幫助企業建立符合自身實際情況的低代碼技術規范,如技術管理規范、設計規范等;·幫助企業深化數字化轉型,如數字化人才培養、項目落地咨詢、協同開發等。這樣的綜合服務,不僅能幫助企業構建穩固的數字化基礎,還能助力客戶在低代碼時代中取得更大的成功。軟件公司通過提供全方位的咨詢和解決方案,能夠與客戶緊密合作,通過持續的創新幫助客戶實現數字化發展目標,共同推動數字化轉型的成功,創造更大的價值。開啟低代碼轉型的最佳實踐過去五年來,葡萄城與三百余家軟件公司深入合作,共同探索低代碼轉型的路徑,我們親身經歷了一家家軟件公司借助低代碼技術實現了業務的騰飛,也很遺憾地看到一些軟件公司走過的坎坷歷程。回顧這些經驗和角度,我們梳理總結出軟件公司實現低代碼轉型的最佳實踐,其中包括了指導思想、關鍵步驟、時間規劃,以及大量的文檔模板和培訓資料。限于篇幅,本文只簡要介紹其中的關鍵步驟,具體包括:確定轉型戰略、探索轉型路徑、打造組織能力。1.確定轉型戰略確定轉型戰略可以從低代碼戰略負責人、低代碼在公司發展的定位和低代碼代碼選型指標三個維度來考慮。低代碼戰略負責人:轉型戰略需要由軟件公司技術副總以上的高層來制定,而非僅由開發人員或部門經理負責。轉型戰略也需要在公司管理層達成共識,這樣不僅可以保證軟件公司從應用、技術、成本等多個角度全方位評估低代碼的價值,同時還可以制定出更適合自身發展的戰略,幫助企業更好地把握低代碼轉型機會。低代碼在公司發展的定位:把低代碼定位為公司技術能力發展的長期技術棧,而非臨時項目或實驗項目。低代碼開發平臺擁有巨大的潛力和優勢,能夠極大地提高開發效率和靈活性。通過將低代碼技術納入公司的長期技術戰略,將能夠幫助企業實現持續的創新和增長。低代碼選型指標:建議基于公司長期規劃遴選評估項目,在覆蓋全場景的同時,還要關注低代碼技術與現有開發團隊、項目管理方式的兼容。基于我們的實際從業經驗,并參考一些專業機構的研究報告,我們總結出面向軟件公司的低代碼選型評估十大指標如下:·功能組件豐富程度與需求匹配度·可擴展性(平臺級擴展)·易用性(開發環境的用戶體驗、性能、配套培訓資源等)·集成便利性·技術與架構的兼容支持范圍·安全性與合規性·編程能力(項目級擴展)·協同開發能力·開發周期覆蓋度·基于關系和流程的模型驅動能力與開發效率2.探索轉型路徑確定轉型戰略之后,下一個重要問題就是制定轉型路徑。有兩個關鍵點需要關注:一是組建低代碼“先遣隊”,探索轉型路徑。建議先遣隊由企業抽調少量開發人員和技術高管共同組成,基于廠商提供的技術資料和資源完成初步的技能準備。二是選擇合適的試點項目,啟動轉型實踐。在篩選試點項目時,要選擇一個需求明確、復雜度適中且能在1-2個月內交付的項目。這樣不僅有助于快速驗證轉型的可行性和效果,還可以為后續的轉型工作積累經驗和信心。3.打造組織能力在探索轉型路徑之后,還需要制定一系列規范將其轉化為真正的組織能力,包括需求分析規范、設計規范、編碼規范、集成規范等。通過這些規范和低代碼平臺的結合,實現更加高效的開發與協作,在實踐中持續迭代優化,打造組織能力。特別提醒的是,低代碼轉型的效果是逐步呈現的,而不是一蹴而就,我們需要對此保持合理的期望和耐心。下圖展示了低代碼轉型過程中,代碼開發與低代碼開發的典型效率對比。其中,橫軸表示時間,縱軸表示開發效率的提升。橙色的線是以Java開發的平均效率作為參考,藍色的線則代表使用低代碼開發的效率變化過程。從圖中可以看出,在轉型的初始階段,因為團隊的不熟練,低代碼開發的效率可能會低于代碼開發方式。但隨著轉型的推進,進入探索期之后,低代碼開發的效率將會趕上并超越傳統開發模式。當轉型進行第三階段時,低代碼的開發效率將大幅領先傳統開發模式,這才是低代碼技術的實際價值體現。結語從以上的信息可以看出,低代碼已經成為業界的趨勢,未來的2到5年將是應用普及的重要窗口期。建議軟件公司將低代碼技術作為重要的戰略舉措,盡快引入低代碼技術,開啟低代碼轉型,提升生產力并響應企業需求的新變化,從而在激烈的市場競爭中保持領先優勢,實現可持續增長。本文來源:R艾瑞網文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
小程序變“傻”,誰變聰明了?
期待下一個五年,中國資本市場脫穎而出的“獨角獸”,不再是清一色的互聯網公司,而是還有SaaS服務公司。互聯網掀起的平民化浪潮,如今已波及到技術人自己。一個人人都是程序員的時代正在到來。廣西柳鋼一名鋼鐵工人,用低代碼平臺,給全廠7000多名員工開發了一個核酸登記應用程序。四川古藺一名中學老師,也是用低代碼平臺,給留守學生開發了一個宿舍管理應用。上海一個11歲女孩,在云棲大會上用8分鐘編出了一個小程序……小程序“傻瓜”化,誰變聰明了?11月17日,中國社會科學院大學數字中國研究院與螞蟻集團研究院聯合發布《2022中小實體企業“數實融合”新趨勢觀察》報告回答了這個問題。01.低代碼開發極大降低數字化成本報告總結了這兩年發生在中小企業身上的九個變化,其中一個變化——低代碼開發極大降低數字化成本——既是中小企業“數實融合”的新趨勢,也是小程序“傻瓜”化的直接原因。“低代碼”是一種只需要寫很少代碼就可以生成應用,并快速配置和部署的一種技術和工具。這一簡易編程技術如今在我們的生活日常中已無處不在。我們玩的游戲,每天都會打開的各類小程序,背后都有低代碼的身影。Gartner報告預測:到2023年,超過70%的企業將采用低代碼作為他們發展戰略的關鍵目標之一。到2025年,整體低代碼開發平臺市場規模將達到290億美元,年復合增長率超過20%。低代碼開始席卷全球互聯網,始于2016年,微軟首次發布低代碼平臺PowerApps,次年,微信、支付寶接連推出小程序接口,讓低代碼在中國找到了大施拳腳的應用場景。報告數據顯示,五年前,一個中等規模的小程序,開發周期為2-3周,現在只要10-14天。如果是一個只用拖拉拽來搭建的簡易小程序,最快五分鐘就能完成。一個小程序的年服務費,最低已降至幾百元。要知道,成本,是中小微數字化轉型最大的障礙。有研究表明,數字化成本如果超過中小微總資產的10%,他們往往就放棄了。數字工具越來越輕、越來越“好用不貴”,成為許多中小微邁出數字化第一步的動力。值得一提的是,報告組在發布會上說,他們在調研時還發現了一個有意思的現象,僅在廣州,就有近兩千家小程序開發公司。小程序開發者中,不乏曾在流水線上打過工的“廠哥”。一家受訪公司的HR告訴他們,同等能力和經驗下,他們更傾向于招“廠哥”,因為他們比本科生能吃苦,流動性也更小。報告組還采訪過一個叫周一海的“廠哥”,之前在東莞一家電子廠工作,利用業余時間線上學習低代碼開發,跳槽到深圳一家小程序開發公司做前端工程師。和深圳許多互聯網創業公司一樣,周一海所在的公司要求員工起一個英文名,周一海給自己起了一個諧音名John。John如今一個月稅后一萬元出頭,是在工廠時的近兩倍,比本科應屆畢業生的平均薪資也稍高一些。報告數據顯示,僅支付寶小程序開放平臺接入的數字化服務商目前就有1.1萬家,拉動的開發和運營崗位接近80萬人。這是一個值得期待、相互成就的生態故事,也是報告中指出的又一個趨勢——數字化服務商將成下一個風口。02.數字化服務商將成下個風口?數字化服務商中的一支主力是SaaS服務商。SaaS意為“軟件即服務”,也就是插即用的數字化小工具。它的特點是基本不需要使用者自己做開發,在訂閱SaaS服務后,即插即用。和IaaS、PaaS一樣,SaaS屬于云服務的一種,三者“長相”相似,所長卻大不相同——IaaS相當于水電氣三通的“毛坯房”,PaaS相當于“精裝房”,而SaaS則是拎包入住的“酒店式公寓”。可見,互聯網平臺云計算等技術基礎設施的成熟完善,是SaaS服務發展的前提。而小程序的普及,則讓SaaS服務市場找到了為中小企業提供數字化服務的重要載體。報告指出,當中小企業的數字化步入深水期,即不再滿足于單一環節的數字化,而是追求全鏈路的數字化時,互聯網平臺企業開始變得“有所不能”。比如,平臺企業往往只能提供通用的技術,以及標準化的獲客和營銷手段,而無法深入到各個垂直行業,為中小企業提供制定化、靈活的數字工具和數字服務。而這正是SaaS服務商的擅長。SaaS服務商對行業有多了解?報告組在發布會上分享了一個細節,他們在安徽合肥,調研了一家叫企邁科技的餐飲業頭部服務商,創始人為了了解咖啡館和奶茶店的的經營場景和痛點,自己開了一家線下店,從德國進口咖啡機,從星巴克挖來資深咖啡師,就這樣鉆到行業里,邊賣咖啡邊發現問題,收集了近100個需要優化的需求。螞蟻集團數字化生態開放運營負責人張琤坦誠,支付寶小程序團隊剛開始時,什么行業都想自己去專研、自己去服務,很快發現,“無論如何也專業不過服務商”。其實,“下場自己干”,是許多平臺企業擁抱實體的常態。比如阿里巴巴為了改造服裝制造業的生產供應鏈,自己建了一個智造工廠;京東則將自己重新定義為了“新實體企業”。但在服務業中小微數實融合這條賽道上,螞蟻集團開始“向后退”,但“向后退”不意味著不作為,而是通過在后方為SaaS服務商開放產品技術、數字生態和平臺“原子能力”,助力SaaS服務市場發展,由其向服務業中小微提供“好用不貴”的數字化工具。簡單說,就是平臺和服務商拿出各自的長板來打配合。梳理支付寶小程序在這一兩年的布局和變化,不難看出他們在不斷向后調整“站位”,讓市場化的力量自己動起來——推出小程序快速搭建能力,讓服務商的開發者乃至商家自己,通過拖拉拽的方式,最快五分鐘就能做好一個簡易小程序并上線。這已經不是低代碼開發,而是搭樂高一樣的零代碼了。推出小程序云托管,以此為載體,為服務商開放隱私計算、安全風控、個性化推薦算法等底層技術能力。推出“跨平臺框架”方案,以幫助服務商實現只需要寫一套代碼,就可以同時生成不同平臺上的小程序,降低不同平臺的適配和遷移成本。在餐飲業頭部SaaS服務商企邁科技IOT事業部負責人阿祖的眼中,平臺現在越來越像“服務商”,讓他們在小程序后端的創新開發中獲得越來越大的空間。他說他曾有一段時間來杭州出差,都是以“月”為單位的。他們和螞蟻的工程師一起,腦暴出了一系列長在支付寶小程序上的,總有一款你用過的爆款小功能——當你在小程序上點了一杯奶茶,可以在支付寶首頁上看到取餐進度;當你在線下單了一杯咖啡,拿到手上時,發現貼在杯身的單子上印著你的名字,以及一句寫給你的土味情話;當你通過小程序下單并選擇“自取”,就能獲得5G螞蟻森林能量球;……報告亦指出,如果中國的服務業數字化要走向縱深,實現高質量發展,必須大力支持發展SaaS行業,壯大中國第三方技術服務市場。而在助推中國SaaS服務市場騰飛,長出“獨角獸”這件事情上,互聯網平臺企業應承擔更多責任。03.一個世界級的生態故事SaaS服務市場長出“獨角獸”為什么很重要?因為這決定著,中國的產業互聯網能否像消費互聯網那樣,擁有世界級的競爭力,同時還決定著,中小微實體企業能否規模化地完成數字化轉型。而眼下的事實是,中國的消費互聯網有多領先全球,美國的產業互聯網就有多一騎絕塵。報告數據顯示,2020年,中國SaaS市場規模約為50億美元,僅相當于美國SaaS巨頭Salesforce一季度的營收規模。這個差距,直接決定了兩國中小企業數字化水平的差異。過去十年,隨著云服務模式不斷成熟,發達市場的數字化收益群體從頭腰部企業不斷向中小微企業下沉。美國餐飲業頭部SaaS服務商Toast的客戶,平均只有1.65家門店。美國50人以下的小微企業,和上千人的大企業一樣,每個員工平均會使用8個SaaS應用。Shopify、Square等市值達數百億美元的SaaS公司,客戶中80%是中小微……相比之下,盡管中國的SaaS服務商站在了風口之上,但眼下中小微企業在SaaS用戶中的占比仍不足10%。我們期待下一個五年,中國資本市場脫穎而出的“獨角獸”,不再清一色是互聯網公司,而是還有SaaS公司;再下一個五年,中國能出現美國Salesforce這樣千億市值的SaaS公司。這樣的未來可期。過去10年,中國互聯網公司大量上云,帶動了中國IaaS層領先于SaaS應用層快速發展,也就是說,大量“大樓”已建好,“毛坯房”也變成了“精裝房”,就等著SaaS服務商入場搞“軟裝”了。此外,在助力中小微企業數字化轉型的賽道上,隨著螞蟻等互聯網平臺企業開始調整策略和站位,SaaS服務商在技術研發上的資金投入和時間成本將被大大降低。這樣的未來值得努力。要知道,SaaS服務市場的繁榮,還是一個世界級的生態故事。Salesforce發布的經濟影響力白皮書顯示,2019年,Salesforce每賺1美元,其全球生態賺了4.29美元;2024年,Salesforce每賺1美元,其全球生態將賺5.80美元。所以,中國小程序“傻瓜化”,是件好事情。它變“傻”,是因為中國數字化浪潮的參與者們變“聰明”了。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
小心這三個坑:用人工智能開發與傳統軟件開發有著顯著不同
生成式人工智能的不確定性會給軟件開發帶來麻煩神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。編者按:鑒于人工智能寫代碼已經非常溜了,你很容易會產生這樣的想法,既然臟累活都是人工智能模型干的,那只關注市場需求和商業模式就行了。錯,生成式人工智能天生具有不確定性,這個坑可得注意了。文章來自編譯。在我們這里,做的每件事背后都有一個基本循環:寫作->開發->重復。開發會讓你接觸到以前隱藏的世界。寫作能幫你找到一種精確、簡潔的方式來表達你知道什么以及為什么。這個循環未必是線性的——有時候我們會從開發開始,然后轉向寫作,有時候我們會先從寫作開始——但我們認為,這種做法確實帶來了一種特別有效的創造新事物的手段。本文深入闡述了用AI開發產品的方式,為什么新的AI產品的關鍵風險是可行性,以及如何通過快速實驗來應對這些風險。當我開發第一個AI項目時,所采用的方法跟過去開發產品是一樣的:明確一個問題,規劃解決方案,構建最小可行產品(MVP),然后進行迭代。這是一種相當直白的軟件驅動法:快速開發,測試,學習,然后改進。但是,這種方法并沒有奏效——于是我自問:用AI開發跟傳統軟件開發究竟有何不同呢?我加入公司的時候是懷揣著一個很有野心的目標的:在三個月內打造九款產品——也就是每10天打造一個項目。我的第一個項目Mindtune是傳統廣告技術和社交媒體算法的替代品,用AI驅動的。我的假設是,大家對社交媒體推送那些公式化的、冷漠的內容已經厭倦了,而AI可以提供更相關、更個性化體驗的機會。我做Mindtune的時候就考慮到了需求驗證,因為傳統軟件項目這一塊往往做不好。你得做出登錄頁面、跟潛在客戶交流、分析競爭對手,然后才會投入資源打造產品。創始人長期以來一直都是按這個模板走的,就好象是一種條件反射。我們未必會停下來問問自己打造這個產品是否有可能?用人工智能開發需要我們打破慣例,用不同的方式去做。人工智能產品帶來了一系列的獨特風險,如果你不了解這些風險,就肯定會犯錯誤。在做Mindtune的過程中,我識別出了三種風險模式,這些模式幫助我準確了解自己承擔的風險類型,更重要的是,讓我了解是什么決定了它是否成功。我會深入探討其中的每一種風險、它們之間的關系以及人工智能是如何顛覆了傳統的初創企業“風險鏈”的。我希望創始人和開發者能夠更好地了解自己想法存在什么風險,以及如何最好地化解這些風險,從而避免在創意迷宮中走錯路。▍初創企業風險鏈任何初創企業都會涉及到三種風險:可行性(feasibility)、價值以及生存力(viability)。1.可行性風險:是不是確實可以開發出來?這屬于典型的工程挑戰。比方說,SpaceX在開發可重復使用的自著陸火箭時就面臨可行性風險。2.價值風險:用戶從中能否獲得價值?這是產品市場匹配的核心。Airbnb就是價值風險的一個很好例子——大多數人最初認為這個想法很荒謬,認為沒有人愿意住在陌生人的家里。3.生存風險:我們自己能否從中獲取價值?眾所周知,Facebook與Google早期就面臨生存風險。他們知道自己的產品深受人們喜愛,但需要時間和實驗才能找到可持續的商業模式。這三種風險的相互作用方式至關重要。可以把它們看作一個鏈條:可行性→價值→生存力。如果產品技術上不可行,那其他兩種風險就不重要了。如果可行但沒價值,你又會陷入困境。而就算用戶喜歡你的產品,你還是得想辦法從中賺錢。這三種風險可不是按順序出現的;每種風險的大小都會因產品類型而異。傳統軟件的可行性風險一般都不高。Facebook的第一版開發并未涉及任何突破性的技術飛躍。馬克·扎克伯格是在哈佛的宿舍里寫出代碼的。真正的挑戰在于價值和生存力風險:大家會用嗎?它能否成為一項盈利業務?相比之下,深度科技——基因療法、聚變反應堆和自動化通用智能等項目,它們是將全新的技術推向市場。這類創新有明確的需求和商業模式(比方說,一種治療現有疾病的藥物),因此價值和生存力風險較低。其風險在于可行性:深度科技初創企業要冒著風險,打造一些他們不能100%確定是否可行的東西。我以開始覺得Mindtune可能會像軟件產品,可行性風險較低,價值和生存力階段的障礙會大一些。但從我的經驗來看,人工智能會給可行性和價值帶來獨特挑戰,需要新的辦法應對。首先,風險模式不一樣。人工智能初創企業主要分為兩類:一種是深度人工智能初創企業,一種是應用人工智能初創企業。深度人工智能初創企業做的是基礎模型或硬件,比方說Groq的芯片與Figure的人形機器人。其最大的風險是可行性。這些公司通常從事前沿研究,其所追求的突破有無可能實現未必總是很清楚。這屬于高風險、高回報的領域。Sparkle和Lex等應用型人工智能初創企業則是利用OpenAI等公司的現有模型和API。其關鍵風險在于價值。應用型人工智能公司需要證明自己所使用的AI能創造價值,而且比非AI解決方案更好、更快或更高效。此外這類企業還存在可行性風險:AI模型未必不總能按照預期的方式運行,需要更多的思考和改進才能獲得良好結果。Mindtune是一款應用型人工智能產品:它利用了已有的人工智能模型來提供更個性化的社交媒體信息流。我相信它的價值——用戶對不同的社交媒體體驗是歡迎的——而且這種商業模式已經得到現有產品的驗證。但我現在越想越覺得我錯過了一個重要步驟:那就是沒有把這項技術的可行性考慮清楚。我一度認為,就因為我可以設計人工智能模型來提供結果,所以就等同于可始終如一地獲得正確結果。我低估了用人工智能來開發的可行性風險,甚至連應用人工智能的可行性風險也沒考慮到。▍人工智能獨特的可行性挑戰傳統軟件從根本上來說是確定性的:如果邏輯和參數設置正確,代碼就會產生可預測的輸出。生成式人工智能有著本質上的隨機性:結果未必是一致的,輸出質量可能會因輸入數據和模型本身的細微差別而波動。所以你得不斷測試,好確定結果是否可靠,且對用戶來說足夠有價值。因此,傳統的工程直覺并不完全適用。慢慢地,你會意識到人工智能模型能做什么、不能做什么,但這些直覺沒有像對傳統軟件的直覺那么準確。就算是經驗豐富的人工智能工程師也會遇到意想不到的結果。技術可行性風險比傳統軟件更大,因為模型在測試過程中可能會給你帶來驚喜,或者驚嚇。但這種風險不像深度科技那樣令人生畏,深度科技可能需要基礎科學上的突破才能向前發展。相反,生成式人工智能的風險介于軟件和深度科技之間——可行但不可預測。由于這種不可預測性,跟生成式人工智能打交道需要更多的實驗性方法。傳統的軟件開發,精心打造的第一版可能需要一些細微調整——改改按鈕位置,調整一下文案——而不是徹底改造。可是,對于生成式人工智能來說,第一版可能就需要不斷“調整”了——調整提示、合并其他數據、調整參數——為的是提高可靠性,增加用戶價值。而且每次調整都會讓結果略微有所改變,所以不斷迭代、不斷測試對于獲得期望的結果至關重要。我在做Mindtune的時候,一開始先是開發軟件體驗(線框、登錄等),然后測試模型(GPT-4o、Claude3.5Sonnet、GeminiPro1.5和Llama3.2),看看能不能給個性化廣告生成足夠好的內容。這是錯的:評估模型輸出的質量時我發現返回的結果不一致。其實我應該先看看輸出的結果,然后再去折騰軟件組件,因為最終決定項目可行性的是底層模型的質量,而不是位于其上的軟件。這個迭代過程還需要用直覺去判斷什么時候該停止或做出調整。在發揮模型能力與識別模型上限之間有著微妙的平衡。有時候,盡管已經反復調整過了,但輸出可能永遠也無法達到可接受的質量,這時候你就得放棄了。或者,你可能會覺得再迭代幾次就可以得到想要的結果。不過,這個階段也有玄機。有時候,應用人工智能缺乏可行性表明這個項目不值得去做。但有時候,盡管可行性較低,可你仍確信是有價值的——因此不該放棄這個項目,而是應該換個做法。你可能一開始以為自己做的是一個應用人工智能項目,然后意識到自己其實在做的是深度人工智能,而且為了讓項目可行,你得進入研究模式,去構建自己的模型。這樣一來可行性風險會增加,但項目價值也可能變大,因此更值得去做了。▍了解風險,找到方向是,不管做什么你都得了解風險狀況,但這一點對于人工智能來說尤其重要。如果你知道所需承擔風險的性質,就可以確定該優先分配資源和精力到什么地方。這還會迫使你在每個階段提出合適的問題:我們能做這個嗎?別人會用嗎?只有這兩個問題搞定后,才可以提出能否圍繞著它建立可持續發展的業務這個問題。不管是應用型還是深度型的人工智能初創企業,其運營的復雜程度與傳統軟件產品都不一樣,需要更深入了解風險的相關性,并愿意去探索未知領域。很多開發者以為用生成式人工智能API就可以消除技術風險,但那只是多套了“一個殼”而已,別自欺欺人了。那怕使用的是現有模型,也需要進行大量實驗。低估這種技術風險會導致浪費時間浪費資源。你很容易會產生這樣的想法,既然臟累活都是人工智能模型干的,那只關注市場需求和商業模式就行了。但實際上,確保人工智能按需要運行是重大挑戰之一。實現可靠和有價值的結果需要的不僅僅是接入API,還需要你不斷調整、測試和深入了解模型的行為。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
服務即軟件(Service As A Software)為什么會替代現有的軟件?
未來,軟件開發模式需要從以功能為核心轉向以業務目標為導向。最近全球知名風險投資機構紅杉資本發布了AI行業年度報告《GenerativeAI'sActo1》,總結了在生成式AI革命的兩年時間里,AI生態系統發生的變化及對未來的預測。報告中有幾個觀點我非常贊同:1.新的ScalingLaw:推理競賽已經開始(1)o1代表通過“推理時計算在一般推理能力上的重大進展,給與模型推理時的計算越多,模型的推理能力就越強,這將推動應用層的可用性2.SaaS重新定義:服務即軟件(1)在AI時代,代理推理將“SoftwareasaService”轉向“ServiceasaSoftware”3.領域專業知識重要性(1)將專業知識與模型能力結合是構建數據閉環、從副駕駛(copilot)到自動駕駛(Autopilot)的關鍵。再看Gartner10/21發布的TopStrategicTechnologyTrendsfor2025。其中,AgenticAI名列十大關鍵字之首。AgenticAI系統會自主的計劃并采取行動來滿足用戶定義的目標。當前的AI助手和大語言模型能夠完成包括生成文本、總結內容或者使用基礎的工具,但是它們并不能夠主動的采取行動,它們是按照用戶的提示詞或者根據編排好的流程來行動。AgenticAI以目標驅動的規劃能力,也承諾能夠交付更有適應性的軟件系統,能夠完成在眾多領域內沒有被定義過的任務,而不是只能完成設計的功能。AIAgent的能力可以被視為一個連續的光譜,從在特定條件下為傳統軟件提供智能,以完成特定任務;再到完整的AgentiAI系統——它們能夠在環境中自主學習,規劃策略,做出決策,并獨立執行任務。那么不同領域的兩個權威機構做出預測的背后,反映了怎樣的技術趨勢?根據這樣的技術趨勢,我們又能推測出怎樣的商業趨勢?數智化變革的核心瓶頸在“人”LLM技術的突破,大家都有目共睹,從ChatGPT時刻發生到現在,我們可以看到的是正如智能摩爾定律所預測的——隨著開源LLM能力的迅速提升,推理成本則指數級下降,因此自然語言理解和表達能力對于任何軟件已經觸手可及。而OpenAI今年9月剛發布的o1模型,則打開了推理能力,大模型的推理能力可以由推理時間的ScalingLaw來提升,這必將帶來的是,隨著時間的推移,推理成本能夠指數級下降。于是,任何軟件又可以再一次獲得極其便宜的推理能力。這將給企業軟件市場帶來什么樣的變化?我們試圖從時尚服裝業過去30年的發展變化中,發現一些規律。從商業角度來看,互聯網革命,本質上解決了消費者和品牌之間的連接問題;互聯網時代之前,品牌必須通過媒體或線下觸達消費者,因此一方面是品牌信號的傳遞速度緩慢,另外一方面,品牌信號的傳播過程也會伴隨很多“噪音”。傳統時尚服裝行業一般是一年為一季,每年都需要經歷對于時尚的判斷、產品設計、小規模生產、時裝秀、拿到反饋,然后生產、壓貨,其中的風險十分大。而從Zara/H&M,到Shein的品牌發展來看,由于消費者注意力越來越多地被吸引到線上,以及線下供應鏈越來越成熟、敏捷,整個循環從年,到月再到周維度,在快速迭代周期中,最重要的是能夠對于新的物種構建起數據飛輪,因為在數字化的世界里,機器的運作是可以24小時*7天的,此時,人的生產能力就變成了瓶頸。但是在其它的大部分行業,從客戶獲取價值的流程中,由于種種原因,他們的業務規劃執行周期仍然類似30年前的時尚服裝行業,是以年或者季度為單位。圖源來自:瀾碼科技以上述業務架構為例,一般企業都會有業務流程,流程中會涉及到橫向的不同職能部門接力來完成一個決策,縱向則有管理來進行管控。而企業內的信息系統只起到了記錄的作用,如過去的大數據系統也只具備單一的分析功能。在由不同的角色橫縱交叉組成的決策網絡中,核心的瓶頸仍然是人。專家知識的數字化和端到端的交互,是Agent落地企業并實現數據飛輪的必要條件那么,有了生成式AI帶來自然語言理解和表達能力之后,會產生什么變化呢?圖源來自:瀾碼科技我們發現,專家知識的數字化是AI助手落地的必要條件,端到端的人機交互對于提高AI助手在業務場景中的準確率也是必備條件,因為這樣能夠更好地解決一線業務人員對于目標上下文理解偏差的問題。但是,在現有的落地場景中,業務人員對于業務目標的拆解、計劃以及在業務活動中拿到客戶反饋等任務,仍然無法由機器來協助。而推理時計算的出現,則為這些環節的智能化帶來可能。如果只是為企業提供更多的自動化/智能化的功能,我們仍然無法解決當前無論是自行購買算力還是買token的成本問題。畢竟現階段技術尚未成熟,推理時的scalinglaw也意味著成本的飆升。由此產生的一個問題是,難道只能等模型的成本降低,才能獲取智能化帶來的價值?我們采訪了很多企業,發現有一個顯著且具有共性的特點:即使是百年老店或者世界500強企業,在業務能力上仍然是“一招鮮打遍天下”,也就是說它們的經營重點大多都是聚焦在放大自己的競爭優勢上。因此,在企業關鍵業務能力方面,業務專家就成為了瓶頸。假設專家將全部精力投入工作也就是“007”,但業務專家能力越是作為企業的競爭優勢,則需要業務專家并行處理的業務任務或業務決策就越多,在此過程中還需要保障業務專家的決策質量,所以,企業需要通過增加新的員工來分擔業務專家的工作內容和壓力。那么,有沒有可能將消費互聯網行業的經驗遷移到新時代的軟件開發中來呢?我們的答案是肯定的。我們認為,可以通過優先找到企業主要價值流程中的決策瓶頸環節,重新設計業務流——讓業務專家設計的Agent去拆解目標,并通過交互收集業務信息并給出業務決策,讓只有在線下完成的業務活動仍然可以由現在的業務人員去執行。也就是說,企業仍然可以在數字世界里面構建數據飛輪。由于是Agent在處理任務、決策,因此可以24小時*7天在線,并且能夠永不疲倦且有耐心的輔助業務人員,通過這樣的數字化流程可以幫助專家節省更多時間成本,對Agent處理的業務任務或決策進行分析,并給出改進意見。圖源來自:瀾碼科技一方面,我們已經看到了o1模型在代碼生成準確率上的提升,使得我們可以有能力準確地執行數字世界中的計劃;另外一方面,o1在強化學習上,關于self-play和processrewardmodel的創新,也讓我們能夠通過專家將商業問題映射到相應的數學問題之后,可以用數百條專家標注來學習到專家的隱性知識。同時,我們還可以通過歷史數據來構建情景記憶,從而完成規劃任務的智能化。最后,也是最難的一步,如何讓專家以低成本的方式讓Agent通過數據進行反思,并改進它的規劃能力,甚至讓Agent自主的從經驗中學習,這個部分可能有待o1模型或者新架構的模型的推出才能夠得到答案。另外一方面,在已有軟件的改進或者新軟件的設計中,我們需要改變過去以功能為核心的軟件開發,變為以業務目標為導向的軟件開發,實現從圍繞功能堆砌到圍繞角色的轉變。圖源來自:瀾碼科技基于此,我們也就能夠理解為什么軟件商業模式會變成服務即軟件。這里簡單引用一下紅杉文章的觀點:紅杉認為,由于Agent推理,人工智能轉型是“服務即軟件”。軟件公司將勞動力轉化為軟件。Sierra就是一個很好的例子。B2C公司將Sierra集成到他們的網站上,負責與客戶交流。Sierra的工作是解決客戶問題,它按每次解決問題的數量來收費,這里并不存在「按席位收費」的概念。你有一個需要完成的任務,Sierra完成了這個任務,獲得相應的報酬。從商業模式上看,還是“上下同欲者勝”。SaaS替代傳統軟件,是因為SaaS模式使得軟件開發者可以知道不同功能的客戶使用情況是怎樣的,那么通過改變收費方式,雖然一次性收入看似降低了,但它讓軟件公司的功能迭代和客戶的付費關聯起來,從而讓SAAS軟件的迭代加速往正確的方向進化。同樣的,大模型令軟件可以交付業務價值時,新的商業模式雖然看上去收入變少了,但會由于利益的原因進一步加快軟件公司去推動數據飛輪的完成。當有新的AI原始軟件公司在組織上完成這一步蛻變的時候,那么就是萬億美元的服務市場向新物種開放的時候。而這場戰爭勢必會像19世紀末非洲的土著部落遇到歐洲殖民者的馬克沁重機槍一樣摧枯拉朽。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/28
AI智能體來了,App會死嗎?
手機廠商VS超級APP,巨頭逐鹿AI時代這個秋天的第一杯咖啡,是智能體幫點的。從9月開始,支付寶旗下AIApp支小寶、智譜的智能體AutoGLM,都能幫用戶下一杯少糖、去冰的生椰拿鐵。榮耀甚至開了個大招——讓智能體YOYO一口氣點上2000杯。當多模態為智能體安上了“眼睛”和“耳朵”,它開始展示出有希望接近人類管家的操作能力——這一代智能體開始學會幫人類“玩手機”,從日常購物、朋友圈評論到旅行規劃,AI都能幫用戶完成。由此,移動互聯網正迎來一場關于智能體的新革命嗎?在移動互聯網時代,超級App通過整合服務形成流量閉環,但智能體的出現,有望重新定義人與服務之間的連接方式。人們開始擔心這場變革是否將重新定義科技公司的新格局:智能體來了,App會死嗎?答案是,殺不死的App,將借智能體再進化。時至今日,超級App遠遠不再是一個軟件,而是一種生活方式的入口。比如,用支付寶,不僅是支付,更是理財、出行、醫療、旅游的生活場景入口;用美團,不僅是外賣,更是餐飲、超市、電影等本地生活聚集地;用抖音,不僅是短視頻,更是海量視頻內容承載的商業生態。過去在移動支付時代,這些超級App下場做“泥腿子”,鋪二維碼、建小程序,通過開放搭建了一張數字服務之網。在AI時代,他們同樣可以腳下沾泥,去連接千千萬萬的線下商家和機構,幫助千萬個商家機構從數字化向智能化升級。當智能體和真實的用戶需求連接,才能真正落地生花。誰能搭建起下一個全面滿足用戶需求的智能體生態,才能成為AI時代的入口之王。從爆冷到走紅,智能體認準“真需求”“可以響應自然語言,并且可以根據對用戶的了解來完成許多不同的任務,稱為智能體。智能體不僅會改變每個人與計算機交互的方式,也將是下一個平臺。”比爾蓋茨關于智能體的這段定義,也是我們想象中AI時代的未來。但在上半年,大廠扎堆押注智能體平臺的1.0階段,真金白銀的投入,卻沒能在流量的池子里快速砸起太大的水花。海外,OpenAI的GPTStore早于今年1月上線,奧特曼曾希望它能成為下一個“AppStore”;國內,字節、百度、阿里等大廠也先后發布智能體平臺,寄希望于打造“Super智能體”(超級智能體)。但在1.0時代,受限于多模態能力發展,彼時的智能體更像是一個能說會道的AI對話機器人,雖然可以為用戶提供知識,但只能止步于獲取建議。因此,在用戶黏性上,大多人對智能體仍然保持“嘗鮮”的態度。即便背靠大廠的潑天流量,在后續的表現上,智能體增長乏力,在平臺上,至今沒有誕生一款Super智能體。歸根結底,是由AI能力創造出的大量偽需求,沒有切中用戶的真實痛點。而和1.0階段相比,智能體2.0在具體的場景上認準方向,試圖切中用戶的“真需求”。此前,AI智能體的B端應用多集中在代碼編寫、輔助創作方面,而在C端,則衍生出了面向用戶的交友陪伴、心理咨詢等智能體。截至今年7月,據QuestMobile統計,文案寫作、職場辦公和情感陪伴成為主流AIGC產品中智能體落地的常見方向。據AI產品榜統計,僅今年一年,智能體數量新增17.9萬,比AppStore的應用增速快了1.5倍。圖源:QuestMobile而在今年下半年,智能體在多任務協同中展現出了諸多改變。“今天的大模型智能正在從簡單應用向復雜應用不斷演進,尤其在智能體到o1推理模型的拓展中,使系統逐漸進化到能夠持續與外部交互。”智譜COO張帆說。設想中的一句話點外賣、訂機票正成為了現實:9月,支付寶推出首個服務型原生App支小寶,作為AI生活管家,能夠幫助用戶承包“衣食住行”,只靠指令就能完成點餐、刷地鐵碼、打車等日常任務,也能智能感知用戶使用的時間和空間,智能推薦新聞播客、快遞查詢、旅游攻略等服務。10月,智譜推出智能體AutoGLM,它能夠自主選擇多款App進行操作,幫用戶完成手機交互。隨后,手機廠商也緊跟步伐,榮耀的YOYO智能助手、vivo的PhoneUse,都能通過一句話的指令幫用戶完成跨應用操作。過去,用戶需要在復雜的界面中尋找海量功能,相當于增加了用戶的使用成本。現在,只需要通過發語音或文字表達需求,智能體就能直達服務,把想要的服務直接推送到用戶面前。至此,切入日常生活的剛需場景,智能體2.0找到了可突破的方向——“管家”智能體。從點外賣、加購物車到取消App自動續費,廠商試圖讓智能體融入我們的衣食住行,進一步簡化人和服務交互的步驟,把用戶從機械日常的交互中解放出來。比如“支小寶”,就一直強調“說句話就能辦事”。盡管目前市面上的諸多“AI管家產品”,能提供的AI辦事服務數量還比較有限,還無法執行更復雜、更個性化的任務,但這個人機交互的進化方向,至少讓我們看到科技正在向一個新方向邁進——除了對話,也能讓AI“看我的眼色行事”,讓生活更簡單一些。AI時代,主導者是手機廠商還是APP?在移動互聯網時代,流量就是生命。智能體的出現,也將重塑流量分發的規則。1.0時代,從海外到國內,科技公司都在試圖打造Super智能體平臺,通過智能體聚合流量。但2.0時代的思路變了。現在,大家正在試圖讓智能體化身手機里的“智能管家”,成為連接用戶和服務的新入口。這種變化最明顯的體現是手機廠商的布局。在2024德國柏林消費電子展上,榮耀產品線總裁方飛說:“如果現在的智慧助手是手機上的手動駕駛,那么,AI智能體未來就是手機上的自動駕駛。”或許會有這樣的預言:當手機上的智能體開始學會跨應用調取所需功能,比如用美團點外賣、打開淘寶買日用品,通過拆解任務場景,選擇不同App操作完成任務。相應的,超級App只需要將部分接口提供給智能體調用,長此以往,App將成為智能體能力的一環,而本該流向超級App的流量,也將歸于智能體。但在多元的商業時代,競合關系才是常態。一方面,手機與超級App需要打磨AI產品,用產品競爭力贏得用戶,爭奪新入口的主動權;另一方面,正如移動互聯網的繁榮是眾人拾柴、日拱一卒的結果,AI時代的服務之網,也絕非任何一家科技巨頭所能壟斷,開放和合作仍是AI的未來之路。正如榮耀CEO趙明所說,兩者之間是協同關系,在找到邊界點后,大家通過各自協同完成分內任務。于手機而言,智能體想要打通完整的服務生態,需要大量的服務資源的整合供給。于App而言,可以深耕垂直場景,借助智能體完成進化,煥新AI時代的諸多服務;同時,可以通過與手機廠商合作,探索軟硬件聯動的更多玩法。比如,在廠商搶做AI搜索產品的當下,包括小紅書、知乎在內的社區App正在試圖通過長期沉淀的內容優勢,打造垂類搜索服務。以知乎為例,它瞄準了學術搜索賽道,在知乎直答中上線專業搜索功能,成為首家提供AI搜索與正版論文庫一站式解決方案的廠商。當下智能體的熱潮中,生態能力也將成為App的殺手锏與護城河。憑借400萬的商家機構小程序以及8000多種生活服務能力,支付寶旗下的AI生活管家“支小寶”就能支持喚起打車、點餐、訂票、地鐵碼、查快遞、交話費、查賬單等各類生活服務——這種生態整合能力是純粹的智能體平臺難以趕超的。同時,目前的手機產商演示的AI點咖啡等操作,仍是采用屏幕識別與仿真操作的技術解決方案(你會看到AI在幫你查看屏幕和點擊按鈕),對手機性能要求高之外,還存在速度慢、服務單一等問題。想要AI做得更好,就需要服務側的供給變革——大量的商家機構也能“AI化”,打造自己的智能體,再通過開放接口,推動生活服務的創新。只有更多商家機構都有智能體,AI才能不停留在點咖啡這樣的簡單操作,而是可以幫你點得更多、點得更快、點得更準,甚至還能幫你找到最合適的優惠券。無疑,就像移動互聯網時代建起數百萬小程序一樣,搭建AI時代的智能體生態,而這正是微信、支付寶等國民App所擅長的。結合獨有的平臺生態,App也能成為新的智能體平臺,并借助差異化的服務從AI混戰中突圍。例如,騰訊繼推出智能助手App“元寶”后,又打造了智能體平臺“元器”;支付寶也推出了智能體開發平臺“百寶箱”,讓商家機構借助智能體為用戶提供更多更新的服務。以“黃小松”為例,它是黃山景區在支小寶平臺上開設的智能體,能夠為游覽黃山的游客提供實時景點導覽、景區飯店推薦、充電寶查詢等服務。此外,App廠商也可以跳出手機,與更多的智能硬件互聯互通,比如AR眼鏡、智能音箱、智能車機等。未來,AI無處不在,服務一呼即應,人機交互的方式將更加多元和革新。此前,字節跳動旗下的豆包就推出了AI智能體耳機OllaFriend,為用戶安排了一位集隨身百事通、英語陪練、旅行導游和情緒加油站等能力于一身的“AI朋友”;下周即將發布的Rokid新款AR眼鏡上,也將聯合支小寶,推出AI打車、AI點餐及聲紋快速支付等功能,覆蓋更多的生活場景。AI時代,洗牌的周期會進一步縮短。朱嘯虎曾直言,“當大家一窩蜂地涌入風口,6個月之后,如果沒躋身頭部,這個風口基本上跟你沒任何關系了。”短暫的風口來臨,沒有人想先離開牌桌,AI將催生下一代的新手機,App也希望借AI再次進化,搶先布局的先行者,無疑將贏得下一個時代。但更為重要的是:獨行者快,眾行者遠,AI時代沒有一家獨大,有競爭,更有合作。開放與連接,原本就是互聯網的本義,進入AI時代,軟件與硬件的彼此開放,無數智能體的相互連接,才能催生真正的變革。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/08
軟件吞噬世界,我們錯失了什么?
想象一下兩家咖啡館:一家在PaloAlto,另一家在北京。在第一家咖啡館里,工程師們一邊喝手沖咖啡,一邊討論API集成。在第二家咖啡館里,運營經理一邊喝著奶茶,一邊集思廣益,策劃病毒式營銷活動。2010年代見證了世界兩大經濟體在科技史上最深刻的分歧。硅谷加倍投入企業軟件,而中國則將賭注押在消費者應用上。這兩種策略都以無人能預料的方式奏效了,也失敗了。共同之處是:兩者以不同的方式完成了社會經濟的數字化。疫情三年,星移斗轉,GPT橫空出世。過去的十年,我們到底錯失了什么,又應該如何進入下一個十年?一、軟件吞噬一切2011年8月,MarcAndreessen在WallStreetJournal上發表了WhySoftwareIsEatingtheWorld一文。這篇文章站在2010年代的開端,一方面回顧了互聯網、智能手機和云計算對商業社會的改變,另一方面拋出了軟件在進一步重塑汽車、零售、物流、金融、醫療保健和教育等傳統行業的觀點。2012年5月18日,Facebook在NASDAQ以1040億美元的市值上市,就募資金額看,是美國歷史上第三大IPO.在資本市場和媒體的一致看好之下,仍然很快跌破了發行價,到了月底,跌去了四分之一的市值。盡管如此,它還是為早期投資人和員工提供了豐厚的回報。這次史無前例的IPO產生了深遠的影響,很多早期員工年紀輕輕就財務自由,同時又深諳軟件的巨大價值,很多人轉身創辦新的軟件公司,Asana、Quip、Cloudera等先后浮出水面,面向企業提供服務。而面向消費者服務的Quora、Path等公司則發展較為緩慢。另一方面,Facebook在IPO之后的十年中通過自身強悍的執行牢牢占住了社交王座,把Twitter和Snap甩開數個身位,成為唯一能在數字廣告市場上與Google競爭的科技巨頭。在收購Instagram和WhatsApp之后,Facebook逐漸形成了近乎壟斷性的行業地位,讓一路看著Facebook長大的風險投資人避免在社交賽道上與Facebook直接競爭。可以說,在Google和Facebook/Meta之后,美國科技業幾乎放棄了在消費互聯網上再造流量入口的嘗試,轉而選擇了一條截然不同的路線,造就了硅谷下一個十年的繁榮。二、美國:SaaS接力移動正如MarcAndreessen預言的,軟件完美接力上一個十年中的消費移動應用,成為新十年的主流投資趨勢。新創辦的SaaS創業公司在2010年~2015年間,增速成一條45%的直線,每年都在1000家以上,直到2018年以后才逐漸下降。從投資金額來看,在2008年~2017年的十年間,風險投資逐漸達到高峰,特別是在A~C輪的成長期,每年投入的金額都在百億美元的級別。這些投資主要都集中在了北美市場的SaaS公司上。從退出的角度看,面向消費者的名字往往因為家喻戶曉而飽受關注,但SaaS公司無論是IPO還是并購,退出數量遠遠超過這個時期的消費互聯網公司。回看這些變化的時候,更會感受到MarcAndreessen文章的預見性。他從Netscape(更像是消費互聯網)到Loudcloud(企業云服務)的經歷,以及對2000~2010年間的趨勢變化的理解,讓他更早地認知到“這是個巨大的機會。我知道該把錢投到哪里”。所謂“巨大的機會”,無非是基礎設施的普及,成本下降,但當人浸泡在這樣的現實中的時候,就會無所知覺。反而是從前個時代穿越而來,才能感受到變化的劇烈,以及未來如何分布不均。從協作辦公,到銷售營銷,到人力財務,再到IT安全,軟件裝上了SaaS的商業模式滲透進企業業務流程的每一個環節。在Microsoft和Oracle的時代(參考:《Oracle:復雜性戰爭》),企業軟件往往以功能的全面性著稱,而在SaaS時代,軟件則以專注于某個環節或者某個行業著稱。自動化平臺Zapier在10年間連接了6000多個企業軟件的應用程序接口(API),成為一家僅融資一輪就盈利的獨角獸公司。API,或者說“接口”,不是為SaaS設計的,但由于SaaS需要和企業客戶對接,開放可編程接口是必備特性。同時,開源軟件社區也逐漸壯大,技術棧中越來越多的開源代碼也需要通過接口相互連接、調用,形成了一整套基于“接口”的軟件生態。在這個生態下,一家公司努力做好一件事,其他搞不定的事情,就找到其他公司的接口來解決。這既是一種軟件開發哲學,也是商業生態的網絡效應,更是資本投入的高效杠桿。三、中國:超級應用崛起中國的故事發生在消費互聯網上。字節跳動把Facebook的Newsfeed發揚光大,在沒有社交圖譜的情況下重新發明了信息流,之后又把短視頻生意做到了全世界。美團和滴滴曾經是“共享經濟”的代表,現在則是本地生活和交通出行的巨頭。拼多多從水果團購起家,現在則以匪夷所思的低價和退貨政策,成為淘寶、Amazon之外的電商新一極。所有這些公司都有一個共同的名字,叫“超級應用”。最先獲得這個稱號的其實是微信,而后,中國的消費移動應用都開始在產品增加更多相關或不相關的功能,依靠各種小紅點、推送通知或游戲化獎勵做產品內部的引流和滲透。微信依靠春晚紅包獲得了支付能力,美團從團購變成了“送啥都快”的生活小幫手,拼多多和支付寶都可以看視頻,抖音和快手則可以購物和打游戲。閉環,是中國互聯網上黑話中的黑話;入口,是中國投資人眼中的皇冠上的明珠。順著“閉環”的“入口”看進去,只剩下直播間里賣的新國貨。我曾經和一位中國的頂級風險投資人交談,他歷數了自己投資過的中國SaaS公司,這些名字遠沒有其美國同行響亮,慘淡經營,也難以看到上市退出的希望。在GPT橫空出世之后,美國SaaS公司紛紛開始向客戶提供AI功能,過去已經建立的客戶基礎和產品場景為AI提供了通路和上下文,大大提升了在AI上創新投入的回報確定性。在中國,AI應用卻因為缺乏場景和商業模式而進展緩慢。上一個十年的錯失,會改變未來數個十年的路徑。四、錯失了什么,為什么?我在《視頻生成:AI的十億消費者機會》一文中表達過一個觀點:消費互聯網(ConsumerInternet)鋪路,企業互聯網(以SaaS為代表)造車,后者并不是一個獨立發展的趨勢,而是前者達到臨界規模后的衍生。這句話其實和MarcAndreessen講到的“軟件吞噬世界”的先決條件沒有本質區別:正是因為互聯網在消費者側的大規模普及,才能推動云計算等基礎設施的快速鋪開,為企業軟件的成長奠定基礎。在上一個十年中,中國市場長出了短視頻,也很快把TikTok復制到了美國市場,美國本土的YouTube和Instagram也快速跟進。加上疫情居家辦公的影響,短視頻在企業營銷、教育培訓等方向愈發重要,也催生了大量的衍生基礎設施。那么,中國市場錯失的是SaaS嗎?從投資回報的角度看似乎是這樣的。但仔細看,中國的企業軟件很多沒有以獨立公司的形態存在,而是作為大廠“閉環”生態的一部分而存在的,更具體來講,往往是和云計算業務捆綁在一起。這其實很像Google/Microsoft提供的企業軟件,往往是用來敲開企業客戶購買云計算服務的敲門磚一樣。類似的,在騰訊/阿里/美團的電商生態中,也蘊藏著大量與零售、金融、物流等相關的軟件。這些來自大廠深處的企業軟件,延續了消費互聯網那種燒錢換規模,然后羊毛出在豬身上的“入口”邏輯。它們用免費+捆綁銷售的形式進入市場,憑借自身強大的市場開拓能力跑馬圈地。這種邏輯,不僅僅消耗了大量的資本,也綁住了大量的軟件工程師人才在一個高度集成的項目上,而非通過不同產品之間的“接口”進行重新組合。在2010年~2020年中,大廠的戰略投資逐漸崛起,而以LP回報為目標的風險投資基金則且戰且退。戰略資本的最高目標是實現企業的戰略意圖,如果大廠是在超級應用上競爭,那么投資的目的也是如何更好地打造閉環,而不是打造更多的開放接口。早期創投的價值在于多樣性,而多樣性來源于開放性。這需要生態里面的玩家抱有“接口”心態,而不是“入口”心態。SaaS或許是因為中國企業服務市場的整體現狀而未能得到機會,但其慘淡現狀也反映出中國創投生態的問題。美國的生態截然不同,下面分成幾個層面來看。技術層面:以GitHub為代表,基于開源軟件生態,出現了一批開發者工具(DeveloperTools),圍繞軟件開發的各個環節,專門服務軟件工程師這個成本昂貴的群體,進而服務企業中的核心數字資產和業務流程。這意味著,軟件開發的生產效率在不斷改善,軟件工程師的人效在持續提升,軟件工程的穩定性和可靠性也越來越有保障。產品層面:產品講求差異化,不做同質化競爭,最終導致的結果是在垂直領域和業務環節都會出現細分。要么選擇一個大的垂直領域,端到端的把業務扎下去,要么選擇一個通用性很強的環節,做寬度和覆蓋,把客戶在這個環節上的需求都吃掉。這一點是和消費互聯網非常不同的地方,后者規模經濟極強,最終往往是“一家獨大”的市場格局。市場層面:既有PLG這種以產品特性為主導,更接近消費互聯網用戶增長打法的路徑,也有SLG以銷售為主導的路徑。很多創業公司在起步階段就有1~2個DesignPartners,通過一定的股權綁定,作為“天使”客戶提供產品建議,并鎖定為最初的標桿客戶。同時,2010年成長起來的這些SaaS公司也培養了一代在經驗、能力、人脈資源都更成熟的銷售、市場人才,成為從技術到客戶之間的潤滑劑。另外,創投圈也是初創公司的客戶來源,降低冷啟動的難度。財務層面:SaaS的核心是用標準化產品來替代非標準化的服務,從而大大提升企業財務的經濟性。美國人力成本高昂,軟件公司特為尤甚,本土的核心團隊規模都不會太大,追求人效,不愿意靠堆功能、做外包來贏得客戶。很多做到億級ARR的公司,團隊規模還在500人以內。也有很多初創公司在百萬美元ARR的規模上就開始盈利,對風險投資的依賴也在減小。投資層面:風險資本也跟隨產業趨勢逐漸細分。特別是在早期投資的市場上,以YCombinator為代表的加速器/孵化器大量出現,AngelList上也出現了天使投資的RollingFunds,LP可以按照季度進行小額定投(每季度在1萬美元左右),還有一些VentureStudio的孵化模式,以及資金規模不高、但強調dealflow的獨特性的Microfunds.融資渠道的多樣化大大增強了資本市場對創新的包容性。在生態的不同層面上出現的變化,核心在于其開放性,而不是包含在某個大廠的“閉環”中。一個值得玩味的說法是:中國講“入口”,而美國講“接口”。開放性和多樣性才是中美兩個市場在過去十年最大的差異,而非消費互聯網與SaaS之爭。開放性和多樣性是持續創新的基礎。自2022年GPT-3問世以來,美國的AI生態從芯片和基礎模型開始,到2023年進入Infra、DevTools的階段,到了2024年,企業軟件和消費應用也逐步浮出水面。創新的接力賽一棒接一棒,沒有停歇的意思。中國錯失的,正是這種流水不腐的開放性與多樣性。五、如何進入下一個十年2020年代有兩個開端。一個是Covid-19的開始和結束。它對全世界的社會生活和政治經濟都有深遠的影響。對于科技行業而言,它一定程度上加速數字化的滲透率,特別是對更為傳統的行業而言,僅僅是遠程辦公一個變化就足以驅動很多軟件采購的快速決策。另一個是GPT-3的發布。我們仍然處在生成式AI周期的早期階段,它對人類社會的影響仍然有待展開。一個明確能夠做出的結論是,它至少可以在上一個十年“軟件吞噬世界”所留下的高度數字化的基礎上,提升整個社會智能化的水平。這兩個開端,一個是把軟件周期推向了最高潮,另一個則在高潮之上再添新力,帶領世界進入了AI周期。六、模糊的B/C邊界經過上一個十年,中美兩個市場在很多地方開始互相追平。在基礎設施建設上,美國通過軟件周期把根深蒂固的傳統行業進行了數字化,中國則通過移動互聯網也完成了零售、支付、物流、公共服務等領域的數字化。在人才儲備上,軟件工程師供給穩定,開發工具和技術棧越發高效。在成本優勢上,兩國的人力成本都有不同程度的上漲,但AI周期中也都有明顯的效率改進機會。消費互聯網的創業和投資不確定性更強,而最終的回報也更驚人。TikTok的崛起并不能被簡單理解為是短視頻產品形態的革新,而也要考慮到它突破了Facebook長期占據的SocialGraph,利用個性化推薦算法建立了全新的興趣圖譜(參考:TikTokandtheSortingHat和Seeinglikeanalgorithm)。AI無論在產品形態、交互界面和智能算法幾個角度上,都有機會做到全面創新。難點在于:如何做好用戶增長達到規模經濟所需要的臨界點?這是消費互聯網的基本功,而在過去的十年中,只有Uber這樣的共享經濟公司還存有一些know-how,除此之外,對于大量的SaaS公司,這幾乎是一項失傳的手藝。中國團隊反而在這里已經經歷過更慘烈的戰斗,調動過更大規模的資源,也積累了大量的經驗。在企業市場上,中國軟件公司的確需要面對更不愿意付費的客戶或更封閉的商業生態。但在“出海”已經成為共識的前提下,這不應該成為障礙。真正的難點還應該回到產品和市場契合上來,如何深入到使用場景中去,拿到更多的企業內部數據和上下文,讓AI能夠因地制宜,做出產品的厚度。以及如何構造面向全球的GTM能力,語言、文化、人脈都會成為新的問題。在灣區和一些AI領域創業者交流的感受是:AI在效率改進上的價值很可能并不會強烈地區分消費者和企業。比如生產力工具,很多產品起初的PMF是在專業消費者(ProfessionalConsumers)上的,但最終賺錢是在企業客戶身上——后者更有支付能力。而在AIasaService的模式下,初創公司用AI來提升傳統服務業的效率,成為AI驅動的律師和會計師,面向消費者提供服務。AI周期中的消費互聯網與SaaS邊界越來越模糊。中國的創業者和投資人最不應該擔心的,就是過去十年似乎錯失了SaaS的機會,特別是對于早期公司,這個區別根本不重要。對于旨在全球市場的AI創業者和投資人而言,更應該調整“入口”心態為“接口”心態,發揮各自的長處,分工協作,通過“接口”的網絡效應放大自身的價值;而非在“入口”上同質化競爭,降低資本效率。七、從“入口”到“接口”:開放與多樣我認為,對于中國而言,還需要做好一件事,就是補充早期投資生態的多樣性。在上個十年里,一批新投資人出現了,他們以“$500kisthenew$5million”為口號,往往有著在科技行業的工作背景和人脈,在初創企業更早的階段介入,最終獲得豐厚的回報。現在,我們經常能在公司融資的新聞中看到一長串名字,其中很多人的投資金額并不高,但這些名字本身就是一種網絡效應,為初創公司提供了大量非現金資源。同時,像SAFE這樣的投資工具也簡化了復雜的股權交易,抵消了因為多樣而帶來的額外成本。可以認為,這是一種風險投資的“下沉”策略,更重要的是,它促進了創業生態中的連接性和包容性。在灣區,你很少會覺得一個想法太奇怪,或太愚蠢,或太不符合主流敘事,這不僅僅是對創業者而言的,也是對投資人而言——他們很多人也認為自己是一個創業者,也會以獨特的投資想法而贏得LP的認同。回到中國,在上一個十年中賺到的第一桶金如何能夠以更易得的形式傳遞給AI周期的面向全球市場的創業者?面向全球市場的天使投資、孵化器、加速器、VentureStudio、Hackerhouse都在哪里?有沒有AngelList、SAFE這樣的投資工具來簡化投資流程?創業本來應該是permission-less(無需許可的)。這是一種截然不同的價值創造方式:它需要站在未來,推導出現在可以做出的重大改變。它需要一些涓涓細流來滋養,而不是大力出奇跡式的大筆重注。大廠高管據說已經成為現在中國AI創業里面的半壁江山。他們或許有更強大的資源優勢,更容易獲得資本的青睞。但同時,他們也有很強的路徑依賴,產品想法往往集中在少數賽道上,少了一些想象力。他們動輒千萬美金的融資或許能支撐一個偉大的愿景,但也會打擊生態的多樣性和開放性。在上一個十年的軟件周期中,美國經濟剛剛從2008年的金融危機中走出來,資本變得更加謹慎。而互聯網周期中賺得的“新錢”接替了“老錢”,以更靈活的姿態、更低的門檻支持了軟件周期中的初創公司。對于AI周期的中國而言,也應該出現這樣的創新接力。上一代的創業者成為新一代的投資人,提供資金、經驗和背書,既能做好資產配置,也能支持創新,實現長期愿景。更多的小型基金、個人投資或多種形式的孵化/加速項目,化整為零的滴灌、滋養未來的可能性。資本當然會追求最大的收益,但逐利性也會限制創新的可能性邊界。對于十年的周期而言,最壞的開局莫過于對多樣性的破壞。不要錯失本可以想象的未來。本文來源:虎嗅APP文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/08
中國老人愛上網,但為何沒有一款做成功的垂直App?
銀發文娛是僅次于電商、排名第二的銀發人群互聯網應用熱土,垂直App、微信公眾號、小程序、抖音快手銀發網紅在過去十年依次迭興。2015年開始出現一批專注老年人的App,主打廣場舞的糖豆、主打圖文編輯的美篇、主打視頻編輯的彩視都是誕生在這一年,并先后獲得知名VC和頭部互聯網平臺的數千萬至上億元投資。2016年開始出現大量主打老年人內容的公眾號,最常見的主題是養老金調漲、養生健康、單身老人寂寞情感、社會對老人偏見不公、領袖和明星人物故事。這些內容在互聯網主流視野全放在年輕人身上的2016年,恰好填充了當時快速涌入的銀發網民的閑暇時間,老人分享轉發積極熱烈,10萬+爆文層出不窮,一時間出現許多粉絲數達到數百萬的公眾號矩陣。2017年隨著微信小程序上線,部分App和公眾號向小程序轉移,主打功能以相冊影集、小游戲、小說、短視頻為主,又在短時間內收獲了大批銀發流量。2019年抖音快手的年輕用戶增長趨緩,而銀發用戶的比重開始快速上升,一批個性獨特、思維開放的老年人自己摸索或在MCN幫助下變身銀發網紅,拍攝各種搞笑段子和換裝視頻。他們的粉絲量在短時間內迅速上漲,一批三五百萬粉絲的銀發網紅開始在短視頻平臺上占據一席之地。下面將從功能需求、流量紅利、商業變現三個方面分析銀發文娛互聯網的經驗教訓。一、打磨特定功能需求,鎖定超強粘性銀發用戶銀發互聯網領域最知名的幾個App,在發展初期就鎖定了銀發人群某個方面的強需求,比如糖豆聚焦廣場舞的視頻、學習、交流,美篇聚焦操作簡便的手機端圖文編輯工具,彩視聚焦短視頻的拍攝剪輯制作分享。而瞄準的這個需求越剛性、越粘性,產品功能對這個需求滿足得越好,初期獲得的銀發用戶就越不容易輕易流失,從而成為下一步發展起關鍵作用的種子用戶。當然,個案項目要想成功,不能僅僅滿足于人有我有的功能,因為每個賽道方向都會有很多同類競爭者,廣場舞、圖文工具、有聲影集以及以后興起的各種賽道都是如此。但大部分銀發互聯網項目做得雷同,只是簡單將現有功能模塊復制一遍,然后圖標放大、字體放大,在銀發人群中不會留下深刻印象,最終的命運只會是即用即棄。而上述項目在產品功能上確實是有特點的。比如糖豆為便于廣場舞KOL拍攝出銀發人群眼中的炫酷視頻,開發出綠幕摳像功能,可以將舞者安放在公園、廣場、山川等各種預設的背景中,還可以將單個舞者復制成三、五甚至七八個,在畫面上呈現出群舞的效果。這個功能至少在2019年就已上線,而主流視頻App幾年之后才上線類似功能。再比如美篇,為了便于銀發人群圖文創作,App設計了提供高清圖片、高清視頻、音樂的素材庫,并將其作為會員收費項目。與之對比的是,微信公眾號經過多年發展,影響如此之大,但后臺只提供編輯功能,圖片素材仍需要創作者自己解決。這些創新的功能點,背后蘊含著對銀發人群的深入洞察,這種洞察決定了產品好不好用、是不是真能擊中銀發人群的痛點,決定了能不能在銀發人群中建立獨特的用戶心智,決定了銀發人群是即用即棄還是來了就不想走,決定了在一堆同質化產品中是否能夠脫穎而出,走向下個決勝點。二、抓住流量紅利,順勢起飛2016年后一批專做老年內容的公眾號之所以能崛起,流量紅利所起的作用顯然占了更大的比重。在中國老人人手一臺智能手機之前,銀發人群接受信息的渠道主要是電視、報紙、雜志,信息來源的主體一般是官方媒體。但隨著智能手機在老人中的滲透率越來越高,并在2016年達到一個臨界點,中國老人從傳統媒體平臺大量流失,對互聯網內容的饑渴越來越大,但此時主流互聯網還將注意力放在年輕人身上,相應的老年內容供給非常缺乏。此時一批敏銳的內容創業者轉戰老年人群,聚焦在養老金調漲、養生健康、單身老人寂寞情感、社會對老人偏見不公、領袖和明星人物故事等極易引發老人共情的主題上,無需原創,只要將全網素材整合編輯,就能源源不斷制作出讓老人瘋狂轉發分享的10萬+爆款文。而且單獨一個公眾號顯然不能將老年流量收割干凈,開設幾十上百個公眾號形成矩陣并互相導流,組織公眾號專屬的讀者社群,再鼓勵群里的老人分享轉發到自己的群和朋友圈,形成進一步裂變。這些內容本身具有非常高的裂變屬性,再疊加上空閑時間很多、希望以轉發顯示存在感、間接“暗示”子女關心自己的銀發人群,最終會實現幾何倍數的傳播。再加上當時微信流量成本很低,大量投放花錢購買粉絲十分劃算,因此許多公眾號的粉絲也在短短幾個月內增長數十萬甚至數百萬之多。小程序在2017年后的崛起更是抓住了銀發流量紅利的典范。比如專注有聲影集和短視頻的小年糕,最早于2014年上線App,但一直不溫不火。2017年1月微信小程序面世,當年5月底小年糕就推出小程序,并與公眾號綁定,打通公眾號與小程序之間的無縫導流,從而快速擴充了小年糕的用戶群體。當時一個月之內,小年糕用戶量就從1000萬漲到2000萬。2019年時,小年糕的中老年用戶已經高達1.1億,在全體用戶中占比超過80%。類似的小程序還有很多。根據阿拉丁研究院公布的小程序TOP100榜單顯示,2017年8月開始,小年糕、卡娃電子相冊就進入榜單,之后美篇等圖文制作小程序陸續入榜。2018下半年到2019年,許多模仿跟風的流量玩家進場,在阿拉丁公布的小程序排行榜里經常會看到一些不知名的公司輪番上場。這些小程序的操作非常簡單,相冊類小程序可以直接一鍵更換模板,模板隨著節假日及時間變化,每到節假日期間,這種相冊類小程序就會瞬間火爆,帶來大量流量。2019年開始,受快速崛起的抖音快手短視頻平臺帶動,流量玩家又轉戰短視頻領域,各種短視頻小程序從2019年開始集中涌現。這些小程序中的內容多是來自各個視頻平臺,部分視頻中還留有騰訊、西瓜、火山等平臺的水印。并且這些新進入玩家大量鋪設相同主題相同內容的小程序以及公眾號矩陣,目的也是簡單直接,只為盡量做大流量,為下一步變現做準備。在前述垂直App的發展過程中,流量紅利也曾經起到重要作用,不過場景發生在手機上的應用市場,時間窗口也比較短。業內人士透露,2015-2017年時在應用市場上去做廣場舞App的廣告投放,獲客成本只要1.5到2元,這種方式支撐了少數頭部廣場舞App的快速起量并接連獲得大筆融資。不過在應用市場的投放成本逐漸走高之后,這種模式不再走得通,用戶增量開始枯竭,之后受到抖音快手的虹吸效應,更是出現用戶大量流失的情況。三、變現路在何方?變現是銀發文娛在走過產品、流量兩個關口后必經的第三個關口。下面就來看看銀發文娛都走過哪些變現之路,它們的表現又是如何。廣告上面提到過的流量型銀發文娛項目,一般公司規模很小,團隊只有個位數,但因為掌握著大量老年流量,通過廣告變現,高峰時一個月能實現數百萬元的凈利潤。但這個模式能夠成功的關鍵一是在于流量成本必須很低,二是在于有源源不斷地愿意支付高額廣告費用的廣告主。不過有能力有意愿支付高額廣告費的廣告主是稀缺資源,時常有不正規的保健品、化妝品甚至詐騙團伙隱匿其中,對銀發文娛項目來說存在很高的法律風險。因此一旦流量成本提高或者平臺監管趨嚴,這個模式就很難維持下去。糖豆、美篇等代表性App,對外宣稱用戶過億,如糖豆2020年中老年用戶超2億、55歲以上用戶占比超過50%,美篇2019年累計注冊用戶超1.2億、65%以上中老年用戶。但他們均未披露過廣告收入的數據,只能猜測這些數據并不像想象中那么亮眼。知識付費/會員權益美篇在2019年推出過價格29.9元起/本的中老年回憶錄,根據官方宣稱,2019年雙11期間達6000單/天,交易額破百萬。彩視營收亦無公開數字,有媒體報道會員權益可占到50%,付費人數在數十萬量級,包含兩檔68元/3個月和198元/年,權益包括會員身份標識、視頻制作特權(特殊模板與素材、高清)、社交功能特權(類似陌陌)等。主播打賞多個App都先后推出過視頻直播和主播打賞。據了解,彩視的直播分成在高峰期可占營收50%,活躍用戶月支出在五六十元左右。美篇曾向外透露,2018年全平臺的打賞月流水曾達到千萬級。但真正屬于銀發人群的知識主播和草根主播并不多,反而是顏值主播貢獻的收入比重更大。這看起來更像是一個成熟的主播團隊在做透年輕人平臺后,又選擇一個新的未被開墾的老年人平臺繼續賺錢。旅游旅居旅游旅居在銀發文娛的各種變現方式中相對走得比較成功。疫情前的2019年,多個數百萬粉絲的公眾號矩陣能夠將旅游旅居收入做到千萬量級。另外,一家位于上海地區的老年退休生活平臺,以電視節目、公眾號、直播間、老年報、線下活動為運營載體,據稱擁有一百多萬老年會員,2019年旅游收入曾達到數億元。變現之路如何打通以上梳理足以說明,銀發文娛的大多數變現方式仍未走通,像旅游旅居這種驗證走通的模式在過去幾年又受到疫情的阻擊,仍需要一定時間恢復。而銀發文娛之所以如此難以變現,背后邏輯可以用一個簡化的等式幫助說明,即變現收入等于用戶規模乘以用戶平均收入。一般來說,超大用戶規模匹配低用戶平均收入或者中低用戶規模匹配高用戶平均收入,兩種方式都能實現理想的收入,前者代表是雁過拔毛的互聯網廣告,后者代表是重度氪金的游戲。恰好銀發文娛在過去十年的發展里,常常是中低用戶規模匹配中低用戶平均收入,與上述兩種情況都不相關,變現收入自然提不上來。在用戶規模上,銀發文娛項目在經歷前期用戶高增的流量紅利后,不久就會受到同類競爭者和新興平臺的擠壓影響,用戶規模很容易出現增長放緩進而大量流失。上文提到糖豆2020年中老年用戶超過2億,但具有實際商業變現價值的月活用戶肯定顯著低于用戶總量,而且在經歷同為短視頻競爭對手的抖音、快手、微信視頻號的輪番爭奪后,這個數字無疑會進一步降低。根據QuestMobile數據,2022年8月糖豆的銀發人群月活躍用戶僅為311.8萬。這一數字顯著低于同期頭部短視頻平臺的廣場舞KOL.根據QuestMobile,2022年8月銀發人群用戶在典型廣場舞KOL月活躍用戶規模,“小帥健身廣場舞”為946.7萬,“華州敏兒廣場舞”為726.4萬,另外還有多位KOL月活躍用戶在300萬-400萬之間。主打視頻制作的彩視也受到新對手的強大競爭。根據QuestMobile,2022年8月銀發人群在視頻工具App行業月活躍用戶規模排名中,彩視僅排名第五,月活躍用戶僅58萬,而排名第一的是2019年上線、抖音官方推出的剪映,月活躍用戶高達848萬。微信和抖音、快手上雖然有一大批專注銀發人群的公眾號矩陣和銀發網紅,但粉絲量大多集中在三五百萬量級,與動輒千萬粉絲的劇情段子、顏值主播等大號爭搶廣告收入毫無競爭優勢,如果選擇直播帶貨,與美妝、服裝大號競爭的專業度又顯得很不夠,后者百萬粉絲卻可以年銷上億,靠的不只是粉絲數量,更是對產品設計和供應鏈的掌握。在用戶平均收入上,前文已梳理,大多數情況下銀發付費用戶對線上業務能夠貢獻的收入在幾十元至一兩百元之間,而且付費用戶在整個銀發用戶里占比并不高。之所以線上收入提不起來,是因為大多數App和公眾號、小程序、抖音號、快手號,主要精力都放在內容的制作和傳播上,與銀發用戶缺乏線下場景深度互動,銀發用戶看完即走,雙方之間缺乏情感維系和信任感,從而無法形成強粘性和持續變現能力。因此銀發文娛項目要想走通變現模式,無非是兩條路,一條是做大用戶規模之路,初期依靠流量紅利、內容紅利積攢大批銀發用戶后,不要留戀這個單一用戶群體,而是果斷迅速向全年齡段尤其是中青年人群進發,就如B站、小紅書初期圈定90后年輕用戶后,果斷向80后甚至70后進軍,然后依靠超大用戶規模賺取廣告收入;另一條是做深用戶信任之路,初期依靠線上方式積攢大批銀發用戶后,果斷加強線下運營,線上線下雙輪驅動,做深做透銀發用戶對平臺的信任感,然后用高客單價的產品進行變現。本文來源;虎嗅APP文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/02
校園,超級App下一個必爭之地
超級App,競逐校園。超級App正涌入校園細分場景。校園,正成為超級App們眼中的“價值洼地”。近日,餓了么APP上線“學生版”。目前,全國5000多所高等院校的學生已可體驗新版本功能。當學生用戶將配送地址切換至具體高校,并完成學生賬戶認證后,餓了么APP將顯示定制化的學生版主頁以及學生專屬福利:既包括學生群體特別偏愛使用的甜品飲品、爆紅包等功能,還包含校園食堂、學生拼團、品牌學生價等定制化功能。此外,作為餓了么APP學生版的特色核心服務,餓了么還為學生提供了配送入校、送到宿舍、校園食堂、校內“同學說”等升級服務。餓了么學生版相關負責人鐘朝平透露:“在所有外賣人群中,學生用戶的需求很特別,一個是他們更關注價格和優惠,另一方面出于校園環境的特殊性,他們也需要更多特制化的服務,例如點校園食堂訂單、外賣送到宿舍、同宿舍一起拼團下單等。”當然,餓了么在校園場景想做、能做的事遠不止外賣服務——即時零售是其更核心的著眼點。“即時零售”是指用戶在線下單商品,一小時或半小時內即可送達的業態。根據艾瑞咨詢最新發布的《中國即時配送行業研究報告》測算,2023年即時配送行業規模約為3410億元,預計2028年行業規模將超8100億元。在線外賣用戶規模達5.3億人,占全國網民數量比重近50%,基于高比例的外賣滲透,消費者即時電商消費習慣逐步養成。據餓了么平臺數據顯示,最近一年來自高校的訂單已達超10億單規模,學生群體對外賣的需求已經不止用餐:從三餐到零售,學生群體對供給的品類、品質需求都在不斷提高,美妝、娛樂等悅己生活服務消費占比正在快速提升。餓了么于8月發布“數字校園生態聯盟計劃”,宣布將全面升級“智慧校園”數字化服務,并繼續加大對高校場景的平臺投入。近日,杭州師范大學資產經營有限公司下屬師達公司與餓了么合作,聯合上線高校數智校園生活服務平臺校園“隨e達”。據介紹,校園“隨e達”平臺整合了校園內的各項供給,目前已上線的美食外賣、校園超市、校園文創、師達云超、隨e行、校內商業等服務內容,涵蓋校園生活飲食、購物、出行等方面。同時,“隨e達”可以為管理者提供校園數據的管理和分析。目前,杭州師范大學校內師生已可通過“釘釘師大生活”進入平臺,選擇商品下單后,可以通過支付寶或校園卡進行支付,餓了么騎手會將商品或餐品配送至校內宿舍樓外賣柜或者辦公樓。通過與餓了么共同推出校園“隨e達”平臺,除了通過數字化提升了校內的電商購物體驗,也將即時配送的物流網絡規范化地引入校園。據介紹,校園“隨e達”上線前三天,外賣訂單量已突破10000單。目前餓了么針對校園環境定制了專屬高校配送方案,比如騎手將身著統一標識的工作服,并配戴工牌,便于校方管理人員及師生快速識別身份;騎手將經過培訓與考核,以掌握安全知識、服務禮儀、校規校紀;在校內騎行時,騎手會遵循25公里每小時的限速,并且不得在上下學高峰期時在人流中快速穿行……同時盯上校園市場的,還有二手交易平臺閑魚。同樣在9月,閑魚正式上線“學生魚”新功能,這是閑魚為學生群體打造的專屬交易交流頻道。當搜索到“學生魚”時,點擊頂部入口即可進入閑魚的校園頻道。“學生魚”不僅將各大高校的校園集市搬到了線上,還設置了熱帖、興趣交流、拼團、校園新鮮事等特色功能。接下來,閑魚還將與高校大學生合作,開啟“閑魚校園精英計劃”,邀請學生參與本校“學生魚”頻道的運營。更早前,針對大學生群體,一些互聯網平臺也有所動作。例如,在2021年,bilibili校園便上線。bilibili校園是一個專門為同校同學推出的校園社區,它鼓勵用戶討論所在學校的新鮮事,分享學習感悟和經驗、展示才藝技能等。自2013年起,長租公寓平臺自如啟動針對畢業生的“海燕計劃”,至今已有370萬畢業生受益,自如累計提供的租房支持金額達12億元。據介紹,今年的“海燕計劃”預計將為畢業生提供超億元租房支持,包括押金減免及安家基金。當前,一些線下連鎖品牌也在進駐高校。9月19日,老鄉雞的首家校園店武漢大學校園店開業,這意味著老鄉雞正式布局高校市場,也是其對年輕消費者市場的一次深度挖掘。更早前,海底撈等品牌也將實體店開進大學校園。由于客流量穩定,在校園的商業業態迭代過程中,教輔、培訓等教育高相關度品類最早聚焦校園市場;此后,各業態逐步布局。如今,校園人群也日趨注重價值消費、體驗消費、社交消費、個性化消費,以餓了么、閑魚為代表的泛受眾類超級App正在將校園視為典型細分場景。這背后,是日益龐大的大學生市場。從用戶體量來看,根據官方數據,2023年,各種形式的高等教育在學總規模4763.19萬人,比上年增加108.11萬人,增長2.32%。從消費水平來看,根據天貓商家成長團隊發布的《青春消費陣線——校園市場的無限潛力與蓬勃前景》報告,中國高校在校生消費規模預計在2024年至2028年間從約13000億元上升至約16000億元。同時,人均年消費水平也在不斷提高,從2015年的1.6萬元增長到2023年的2.9萬元,預計到2028年將達3.5萬元。另據艾媒咨詢發布的《2024中國大學生消費行為調查研究報告》數據顯示,七成以上的受訪大學生月均支出水平集中在1000-2000元之間,其中,超四成的受訪大學生月均收入在1501-2000元。其粗估2024年中國在校大學生的年度消費規模約為8500億元。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!
-
24
11/02
語言模型驅動的軟件工具思考:可解釋與可溯源
語言模型在軟件開發的應用與挑戰。語言模型正在變革軟件開發流程的各個環節,包括代碼的生成、編輯、測試、調試等。在開發和訓練代碼語言模型時,人們需要統一的收集清理數據、訓練模型、更新調整等。因此,我們預期,針對模型訓練的分析技術將成為新的一層架構來回答“模型是如何產生某個預測的”、“模型預測是如何逐漸訓練得到的”、以及“我們應該怎么做去修改和增強某個預測”等問題。在今年8月份舉辦的AICon全球人工智能開發與應用大會上,上海交通大學計算機系副教授林云做了專題演講分享“語言模型驅動的軟件工具思考:可解釋與可溯源”,深入探討了如何分析模型、追溯訓練樣本,并構建數字孿生環境來測試代碼編輯模型,最后展望了未來大模型對軟件開發范式的影響。以下是演講實錄(經InfoQ進行不改變原意的編輯整理)。非常榮幸能夠在這里與大家分享我們團隊的最新研究成果。我們一直在探索如何利用語言模型來生成代碼,并深入理解這些模型背后的原理。目前,語言模型在軟件工程領域的應用日益廣泛,已經逐步介入到設計、編程、測試和調試等多個環節。我們的研究團隊致力于將語言模型融入這些環節中。在語言模型出現之前,我們已經有了傳統的代碼編輯的技術,但語言模型的介入使得編輯過程變得更加智能化,我們稱之為“生成式編輯”。它能夠輔助我們完成整個代碼棧的工作。接下來,我會介紹我們與字節跳動合作的一個項目,該項目旨在自動定位代碼編輯的位置,并在特定行生成所需的編輯內容。在語言模型生成代碼之前,我們也在解決測試用例生成的問題。按照傳統方式,我們會將測試用例的生成視為一個約束求解問題,關注如何實現分支覆蓋和路徑覆蓋。但語言模型的出現讓我們開始思考,我們是否可以實現需求覆蓋,即不僅僅覆蓋特定的分支,而是結合需求和分支,生成更符合項目特點的測試用例。此外,我們也在探索如何讓語言模型自動調試代碼。過去,開發者常常自嘲說,自己寫的bug含淚也要修復完。但現在,也許我們要含著淚修復AI幫我們寫的bug.AI時代的代碼調試問題也許是一個新的挑戰。因此,我們也希望有新的智能化技術能夠幫助開發者發現并修復bug.在這項工作中,我們的目標是將調試問題轉化為在代碼執行軌跡上找到第一個出錯的步驟,然后讓語言模型在這個軌跡上通過交互不斷定位錯誤,并指導開發者了解錯誤是如何發生的。訓練軟件工程語言模型的“套路”當我們深入研究語言模型在軟件工程中的應用時,我們逐漸發現了一個反復出現的模式,或者稱之為“套路”。在這個套路中,我們是這么做的。首先,我們需要收集和清洗來自Git、JIRA、Jenkins等軟件工具的數據,將它們轉換成訓練數據集。這些數據集隨后被用來訓練代碼模型,最終這些模型被集成到集成開發環境(IDE)中。無論是進行測試生成、調試、代碼生成還是測試用例生成,我們通常會遵循這個方式。但隨著時間的推移,我們意識到,盡管這個套路在業界得到了廣泛應用,但在實際應用中卻并不簡單。例如,當我們訓練出一個模型后,我們首先想知道的是,模型為什么會做出這樣的預測。畢竟,模型本質上是將大量的數據集壓縮編碼到代碼中,然后利用其泛化能力進行各種生成任務。那模型的預測是如何產生的?我們知道,模型并非一蹴而就,而是經過數小時甚至數天的訓練,經過多次迭代才得到的。因此,我們想要了解模型預測的具體生成過程。最終,我們希望能夠提出一些方案,自動矯正模型中不符合我們期望的行為。上述套路解決的是"AIforSE",即我們提出了AI解決方案來幫助程序員完成任務。但隨著AI解決方案的增多,我們發現需要一個"SEforAIforSE"的基礎框架,以支持和管理這些AI解決方案。案例研究:交互式代碼編輯(CoEdPilot)在具體介紹上述框架解決思路前,我想先跟大家介紹下我們與字節跳動合作的一個研究案例,這個案例恰恰符合我們之前討論的“套路”。我們稱這個過程為“編代碼、編輯定位”。在現代代碼倉庫中,編寫代碼并不總像Copilot那樣,給出一個注釋后自動生成十幾行代碼。更多的時候,我們面臨的是編輯任務:根據需求修改某一行代碼,刪除一行,或者更改一行中的幾個字符串。這種編輯往往是跨文件的,一次編輯可能會影響到多個文件。在我們的案例中,我們首先關注的是編輯定位問題。當出現一個需求或者一個編輯請求時,我們希望能夠迅速定位這個編輯在整個項目中如何傳播。接下來,我們想要解決的是編輯生成問題。一旦我們知道某一行需要修改,我們就想進一步推薦出這一行具體應該改成什么樣子。我們希望通過人機交互來實現這一點,利用人的反饋來進一步推薦下一輪的編輯定位和編輯生成。我們的工作目前集中在開發一個VisualStudioCode插件上,這個插件旨在幫助用戶根據輸入的需求自動定位代碼修改的位置。用戶一開始會輸入需求,插件會生成一個定位提示,顯示整個文件中可能需要修改的地方。在這個提示中,紅色標記代表可能需要修改的地方,而綠色標記則表示可能需要添加內容的位置。當用戶選擇某個特定的位置后,插件會通過一個差異比較(DIFF)視圖來展示這一行代碼可能的修改方式。用戶可以從多個選項中選擇。一旦用戶接受了某些建議或者拒絕了某些建議,這些反饋就會被收集起來,作為新一輪輸入和迭代的數據。這個插件的核心思想在于,我們通過收集代碼提交的信息來訓練模型。每個提交通常包含多個代碼修改,這些修改也被一并收集。通過訓練,模型能夠在整個項目中滑動窗口,識別出需要修改的地方,并推薦出具體的修改內容。代碼編輯的基本設計思路我們的基本設計思路是將代碼編輯任務分解為幾個小模型來實現,避免直接將整個代碼庫喂給一個大模型,這樣做的原因主要是為了減輕模型的計算負擔,包含兩個核心部分:任務分解和矯正反饋。首先,任務分解的目標是將一個大模型拆分成幾個小模型,這樣可以減少模型的輸入量。例如,輸入1萬行代碼與輸入30行代碼的效果是有很大差異的。我們使用三到四個小模型來完成這個任務。其次,我們希望通過與用戶的交互來實現矯正反饋。具體來說,我們首先使用一個小模型,通過滑動窗口來預測文件中可能需要修改的位置。核心思想是比較兩段代碼的語義相似度和依賴關系,以判斷它們是否會產生協同變化。在得到這些信息后,我們使用另一個小模型,將問題轉化為一個分類問題。給定一個滑動窗口,窗口中有多行代碼,我們根據之前的編輯來預測每一行可能發生的編輯類型。這樣,我們不需要處理一個很大的窗口,只需要對每一行進行分類即可。訓練模式采用的是指令微調,即給定一個指令(如替換或保留),然后讓模型預測每一行的編輯類型。得到編輯類型后,我們使用另一個基于Transformer的編碼器-解碼器模型來生成具體的內容。當我們確定某一行需要添加或替換時,就讓這個Transformer生成相應的內容。這樣,我們就大大減少了活動窗口的大小。最后,我們使用另一個模型來學習之前的編輯,將之前的編輯作為Transformer輸入和反饋設計的一部分。通過這種方式,我們在定位的準確性和生成內容的準確性上都達到了一個可接受的程度。哪些訓練數據影響了這次預測?當我們構建并訓練了代碼模型后,我們希望它能夠自動定位代碼編輯的需求,并最終集成到IDE中。然而,我們發現在某些情況下,模型的表現并沒有達到我們的預期。為了解決這個問題,我們首先需要進行訓練歸因分析,以了解為什么模型會做出特定的預測。我們想要回答的核心問題是:為什么模型認為某行代碼需要修改,或者需要插入代碼?為了解決這個問題,我們從三個角度進行思考:樣本歸因、表征歸因和仿真驗證。歸因問題在機器學習領域是一個經典問題。我們想要了解的是,哪些訓練數據真正影響了模型的預測。當我們面對一個嚴格的數學問題陳述時,我們可以這樣表述問題:給定一個訓練樣本Zi,如果我們對這個樣本進行權重調整(增加或減少?),模型會發生什么變化?因為模型是在看到數據后才進行神經元調整的,所以我們想要了解哪些預測相關的神經元是由哪些數據調整的。在數學層面上,這個問題可以通過一個公式來描述。我們有一個測試集_X_test和一個訓練集_X_train.我們想要了解_X_train和_X_test之間的關系。如果我們發現_X_train和_X_test的值是一個大的正數,這意味著如果我們更多地訓練_X_train這個樣本,模型在預測_X_test這個樣本時的表現會變得更好。相反,如果_X_train和_X_test的值是一個大的負數,比如說-0.9,這意味著如果我們更多地訓練_X_train這個樣本,_X_test這個測試樣本的預測會變得更糟,說明這兩個樣本之間存在矛盾。如果_X_train和_X_test的影響因素是0,那就意味著無論我們增加還是減少對_X_train的訓練,對_X_test的預測都沒有影響。要理解模型預測的影響關系,我們可以從理論上推導出三個決定性因素。首先,模型對測試樣本_X_test的擬合程度會影響其預測。每個測試樣本都有其損失函數和標簽,模型在擬合這些樣本時會朝某個方向移動,這個方向反映了參數空間的調整。其次,模型對訓練樣本_X_train的擬合方向也是一個重要因素。如果模型在擬合_X_test和_X_train時方向一致,那么它們之間會有正向影響;如果方向相反,則會產生負向影響;如果方向的夾角為零,則它們之間沒有影響。最后,Hessian矩陣及其逆矩陣代表了所有樣本之間的交互效應。Hessian矩陣是損失函數對所有參數的二階導數的矩陣,其逆矩陣反映了樣本間的相互作用。然而,計算Hessian矩陣的逆在實際中是非常困難的,尤其是當模型參數達到百萬或千萬級別時。為了解決這個問題,我們提出了一種改進的想法,即通過多次變異模型來模擬Hessian矩陣的效果。我們可以通過在參數空間上進行抽樣來模擬Hessian矩陣,觀察模型在多次變異后對訓練樣本和測試樣本的影響。如果變異后的模型在訓練樣本和測試樣本上都顯示出對抗性或正相關/負相關的影響,那么我們就可以認為它們之間存在相互影響。通過這種技術,我們發現模型預測中的一些問題并不總是源于模型架構,而是可能源自訓練數據集本身。例如,在開源數據集上運行模型時,我們可能會發現模型的某些錯誤預測實際上可以歸因于訓練數據的標注問題。例如,在服裝分類任務中,開源數據集可能會將非常相似的服裝款式標注為不同的類別,而人類觀察者可能會認為這些款式是相近的。這種令人困惑的標注會影響模型預測的性能。為此我們設計了新的影響函數在很多開源數據集上找到了很多標注bug,并發表在了NeurIPS’22的會議論文《DebuggingandExplainingMetricLearningApproaches:AnInfluenceFunctionBasedPerspective》上。將影響函數應用于代碼編輯生成任務我們將影響函數應用于代碼編輯生成任務中,以評估每個預測背后的有益和有害訓練樣本。有益的訓練樣本是指那些通過增加訓練量可以提升特定測試樣本表現的樣本,而有害樣本則是指增加訓練量會降低某些測試樣本表現的樣本。我們發現,對于任何一個測試樣本,有害樣本和有益樣本的數量通常都非常少。通過這種方式,我們可以發現模型預測的具體影響。例如,當我們的模型預測需要將代碼中的版本號從0.01更改為0.02時,使用影響函數進行歸因分析,我們可以看到與數字變動相關的訓練樣本,這與模型的表征空間是相關的。在函數調用中添加參數時,模型應該定位到代碼窗口中的某一行,并預測需要替換的行以添加類似的參數。對于這樣的測試樣本,模型的預測和歸因分析將揭示出形狀相似的代碼標注,指出在語法上需要添加子節點。這種歸因分析有助于我們理解哪些訓練樣本對預測有重大貢獻,從而發現可能存在的標注問題。例如,我們可能會發現原本認為相似的代碼樣本實際上在語義上有很大差異,這表明我們的標注可能存在問題,或者標注的語義不夠豐富。此外,在代碼編輯中,commitmessage的質量非常重要。相似的commit或者過長的commit可能會導致信息量減少,從而形成打架效應。這意味著,為了提高代碼編輯的質量,我們需要確保commitmessage的書寫質量非常高,避免使用過于冗長或含糊不清的描述。我們覺得未來可能會有好幾個方向可以嘗試,第一是通過影響函數,可以幫助我們去做數據分析,判斷到底哪些是臟數據,或者說非預期的訓練數據產生了壞的影響。第二個是當產生壞的影響之后,有可能我們需要對整個數據進行重標注,所以我們也在嘗試在訓練過程當中動態地去更新某一些標注,因為我們永遠不能保證人標的東西就一定是對的,或者說預期的標注就是我們想要的。最后是想去觀測,如果有些訓練樣本有非常高的互影響的話,就意味著整個訓練數據集有可能是冗余的。我們大量地在收集數據集,但是數據集過大真的是件好事嗎?對此我們其實也是存疑的,我們有沒有可能利用一個小但質量非常高的數據集產出一樣的效果?這對模型訓練效率的影響其實是非常大的。表征歸因在討論完樣本歸因之后,我們來談談表征歸因。表征歸因是深度學習的核心,因為深度學習本質上是表征學習。無論是處理圖像、聲音還是文本,深度學習的目標是將這些輸入轉換成向量,然后進行矩陣運算。以文本為例,深度學習模型需要將每個單詞映射到向量空間中。在這個空間里,語義相近的詞匯(如“男孩”和“女孩”)的表征應該彼此接近,而語義相距較遠的詞匯(如“貓”和“狗”)的表征則應該相距較遠。在自然語言處理(NLP)中,我們希望模型能夠通過單詞的embedding來捕捉這種語義關系。如果我們能夠訓練模型,使其對每個樣本或單詞的表征具有這樣的語義效果,那么模型就能逐漸發展出接近人類的預測能力,從而能夠進行更自然的交流。然而,我們面臨的一個主要挑戰是,真實的表征空間可能是512維、1024維或768維,而人類很難直觀理解高維空間中的變化。模型訓練初期,樣本的表征通常是隨機分布在高維空間中的。隨著訓練的進行,這些表征會逐漸變化,最終形成一種分布,反映出人類的理解能力。我們可以將模型訓練過程視為樣本表征在高維空間中的運動。一開始,這些表征是無序的,但最終會形成一個有結構的分布。我們希望能夠在二維空間中幫助人們理解這些表征是如何變化的,例如,貓和狗的表征是否真的接近。這將能為提供巨大的信息量,幫助我們更好地理解和改進模型。在過去的工作中,我們的目標是將模型的訓練過程可視化。模型訓練本質上是樣本表征在高維空間中的變化過程,但由于這些維度通常是數百甚至數千維,這使得直觀理解變得困難。因此,我們希望能夠將這一過程投影到二維空間,使人們能夠直觀地看到,例如,兩只貓的樣本表征如何逐漸靠近,而貓和狗的樣本表征如何逐漸遠離。將訓練過程轉化為二維動畫后,我們不僅可以觀察到模型在表征空間中的運動,而且還可以與動畫進行交互和分析。在模型訓練過程中,我們通過可視化技術觀察到了一個有趣的現象,即干凈數據和噪音數據在表征空間中的運動軌跡存在顯著差異。例如,在某個訓練階段,我們可以將橘黃色的點視為干凈數據,而黑色的點代表噪音數據。如果我們觀察到最后一個訓練階段,比如模型學習"apple"這個詞匯時,會發現無論是干凈數據還是噪音數據,模型最終都能達到很高的準確度。然而,它們在訓練過程中的運動軌跡卻大相徑庭。干凈數據在經過一兩次訓練迭代后,很快就能定位到它應該在的區域。相比之下,噪音數據則表現得像“釘子戶”,在初始位置上停留很長時間,直到訓練的后期,由于模型內部的某種“拉力”作用,它們才最終被拉回到適當的位置。這種現象不僅揭示了噪音數據在訓練過程中的頑固性,也為我們提供了一種新的思路,即如何在訓練過程中有效地去除噪音。通過觀察數據在表征空間中的運動,我們可以識別出那些不易被模型正確學習的噪音樣本,并采取相應措施。回到代碼任務本身,我們注意到基于檢索的生成(RAG)是一個非常熱門的領域。在這種情況下,檢索能力變得至關重要。在這個語義空間中,我們可以觀察到代碼表征的分布情況,同樣也可以觀察到代碼描述的表征分布。這種映射允許我們在給定一個自然語言描述時,在整個語義空間中搜索與其最接近的代碼表征。這樣,與描述最相關的代碼就可以被檢索出來。基本上,這是一種在高維空間中進行代碼檢索的方法。通過這種方式,我們可以根據代碼的自然語言描述快速找到相應的代碼實現,從而提高代碼檢索的效率和準確性。這種方法利用了深度學習模型的能力,將文本描述和代碼映射到同一個高維空間,使得相關代碼的檢索變得更加直接和有效。高層語義編輯距離在深入研究模型訓練過程中的表征時,我們有時會發現模型可能只是學習到了表面現象,而并沒有真正理解人類所理解的概念。例如,當我們探討高層語義編輯距離時,可以通過比較兩個序列或字符串來觀察這一點。我們可以將字符串進行匹配,就像在本科課程中學到的字符串匹配算法那樣。這種方法也可以應用于代碼,因為代碼中的每個token也都有一個高維的語義表征向量。例如,return這個詞在代碼中會有一個語義表示,我們可以計算兩個return之間的語義相似度,從而判斷它們在語義上是否大致相似。通過這種方式,我們可以對整篇代碼進行理解。如果我們使用像CodeBERT這樣的模型來訓練代碼,使用表征距離或高維空間的語義表征來對齊兩篇代碼。但是,在訓練的初期,代碼可以被正確對齊,但在訓練的后期,模型可能會將versiondownload這個詞與if的表征關聯得最近,而將data的表征與return的表征關聯得更近。這種現象表明,盡管模型似乎學習到了預測代碼和描述之間相似性的能力,但它的理解仍然與人類的理解存在較大差距。這提示我們在模型訓練和評估時,需要更加關注模型是否真正理解了代碼的語義,而不僅僅是表面形式上的相似性。通過深入分析表征,我們意識到在模型訓練過程中需要加強代碼和描述之間的對齊能力。目前,我們主要采用對比學習的方法來訓練模型,但為了進一步提升模型的性能,我們計劃在訓練中加入更多的對齊機制。仿真驗證(數字孿生)這部分我們想討論的是一種稱為仿真驗證的技術,也就是數字孿生。在模型訓練完成后,我們經常會遇到模型的評估指標,如準確率、召回率和F1分數等,看起來非常高的情況。這些數字并不總能代表模型在實際應用中能顯著提升程序員的工作效率。有時候,即使模型的BLEU分數只差一點點,程序員可能仍需花費大量時間進行調整。另一方面,即使BLEU分數差異很大,也不一定意味著模型的預測結果不對。這是一個非常微妙的問題。為了解決這個問題,我們提出了數字孿生驗證技術。在我們與字節跳動的合作中,我們進行了用戶實驗,讓學生實際使用我們的工具進行編碼。我們發現,即使在學術環境中,驗證模型的預測是否真正有用是一項工作量非常龐大的工作。因此,我們希望通過代碼提交,即編輯歷史的一個結果,來恢復過去的開發過程。我們稱這個項目為“Historian”,就像考古學家通過文物來還原歷史一樣,我們希望通過已知的代碼提交來恢復程序員過去的代碼編輯過程。在這個過程中,我們需要解決一些問題,例如兩個編輯之間可能存在的偏序關系,確定哪個編輯先發生,哪個后發生。通過恢復整個代碼編輯的開發過程,我們可以在這個過程中引入模型,并觀察在什么情況下模型真正有助于提升生產力,或者是否實際上在拖累開發。我們需要評估模型的表現是否真的有助于提高效率,或者它是否與不使用模型時的表現相當。基本思路:從提交歷史重現“當年的”開發過程在我們的工作中,我們建立了一個復雜的工作流程,旨在通過提交歷史來重現程序員當年的開發過程。這個流程的出發點是確定在何種程度的BLEU分數下,模型應該采取下一步行動。我們的目標是利用歷史記錄來創建一個虛擬的程序員,這個虛擬的程序員能夠基于單個提交(commit)恢復出多種可能的編輯過程。在這些編輯過程中,我們的模型將被引入。我們允許對這個虛擬程序員的行為進行配置,例如:在檢查推薦時需要花費多少時間?如果推薦錯誤,他將被延誤多長時間?如果推薦正確,他將花費多少時間進行審查?我們會根據不同情況來設定這些參數。在這個過程中,我們會模擬實際的編輯場景。例如,如果我們輸入一個描述并產生編輯,這個過程可能需要77秒,這包括了第一次編輯、加載語言模型的時間(因為模型不是憑空產生的),以及推薦編輯位置所需的時間。如果我們的推薦正確,我們將計算產生的延遲;如果錯誤,我們將計算延誤的時間。我們還會模擬用戶檢測推薦所需的時間。通過這樣的模擬,我們可以與正常的編輯過程進行比較,以確定模型是在幫助用戶還是影響用戶。通過這種方式,我們基本上可以觀察到,當模型被應用于實際的開發過程時,所有的性能指標,如準確率和召回率,實際上都會出現一定程度的下降。這是因為在現實世界中,模型的表現受到多種因素的影響,包括與人類用戶的交互。這個就是我們的SEfor(AIforSE)框架,旨在探索和改進人工智能在軟件工程中的應用。在這個框架中,我們預見到未來業界將越來越多地采用這種模式。程序員的工作方式正在發生變化,他們不再只是調用和開發API或修改第三方庫,而是可能會需要收集訓練數據來微調模型,就像調整第三方庫一樣。模型本質上是一種特殊的第三方庫,程序員在未來可能需要學習如何編寫更有效的提示(prompt)來與這些模型交互。這可能會形成新的工作模式。隨著這些新工作流程的出現,我們面臨著如何進一步提升和賦權這些模式的問題。目前的模型是概率模型,每次輸出可能并不穩定,同時還需要解決模型輸出的幻覺問題。為了解決這些問題,我們嘗試提出了一些方法。例如,樣本歸因可以幫助我們追溯并理解對特定預測產生貢獻的訓練樣本。通過分析學習后的樣本表征,我們可以在表征空間上進行更深入的交互式分析。我們還提出了一個仿真驗證過程,也就是數字孿生的概念。通過創建一個虛擬的程序員來進行編輯操作,我們可以模擬實際的開發過程,并觀察模型在其中的作用。我們希望這種虛擬仿真的方法能夠幫助程序員或大型企業驗證模型的實際效用。如果我們想在生產環境中引入一個新模型,我們需要說服生產團隊這個模型確實能夠帶來產能增值。通過數字孿生技術,我們可以模擬模型在實際開發過程中的表現,從而預估它可能帶來的效益。展望:AI原生的軟件工程實踐隨著人工智能時代的到來,軟件工程的實踐將發生根本性變化。過去,編程主要是為了交付軟件產品。但在AI時代,編程不僅僅是為了交付,它還具有數據標注的意義。我們編寫的每一行代碼、提交的每一個commit、撰寫的每一個需求,都可能被用來訓練模型。這意味著代碼編輯和整個編輯過程實際上在無形中完成了數據的標注工作。由于模型訓練對數據質量有很高的要求,我們預見未來將出現一種AI原生的軟件工程實踐。我們將利用現有的數據來訓練模型,然后評估這些模型是否符合我們的預期。有了新模型后,我們可以反向工作,利用模型預測的好壞來評估過去的編程實踐是否合適。這個過程類似于梯度下降,從模型預測到生產過程或代碼標注的反向優化。我們可以通過模型的性能和對數據質量的分析,反過來指導整個開發實踐,告訴我們何時應該如何編寫代碼、如何記錄代碼歷史,或者如何提出問題。以前,我們通常依據一些軟性指標來推薦最佳實踐,未來我們將有更硬性的理由來證明為何要這樣編寫代碼。因為這樣做可以使模型訓練得更好。通過這種方式,我們可以不斷調整實踐,形成一個AI原生的軟件工程范式,最終推動整個過程的自動化。本文來源:36氪文章轉載于其他網絡,如有侵權請聯系我們及時刪除!