
核心使命:AI-nization 與 Omotenashi
樂天AI(Rakuten AI)的願景是透過「AI-nization」(AI化)將人工智慧全面融入集團業務,為客戶、合作夥伴和員工創造價值。這項策略的核心精神是日本的「Omotenashi」(究極待客之道),旨在利用AI預測客戶需求,提供超越期待的服務體驗。樂天認為,AI的力量應普及,讓每個人在任何時間、任何地點都能受益。
這項願景體現在其公開提供的服務上,例如樂天AI的聊天服務 (ai.rakuten.co.jp/chat),讓用戶能直接體驗AI的互動能力。
該策略的重點在於打造一個三層式 AI 平台:
- 基礎層(Foundation Layer):由大型語言模型(LLM)組成,這些模型經過優化以適應樂天獨特的資料與商業需求。
- 應用層(Application Layer):由數千個 AI 代理(AI Agents)組成,這些代理能自動執行特定任務,例如處理客戶服務、推薦產品或分析資料。
- 使用者介面層(User Interface Layer):透過自然的語言互動,讓用戶能無縫地與底層的 AI 代理進行溝通與協作。
樂天AI 的最終願景是建立一個強大的 AI 代理生態系,讓 AI 不再只是被動地回應指令,而是能主動預測並解決問題。這將能大幅提升樂天在電子商務、金融科技、行動通訊等領域的服務效率與品質,同時體現樂天獨有的 Omotenashi(究極待客之道)精神。

樂天利用 AI 代理強化「究極待客之道」(Omotenashi)
樂天集團正透過其 AI 策略,特別是代理式 AI(Agentic AI),來重新定義其服務核心價值——「究極待客之道」(Omotenashi)。這篇文章強調,代理式 AI 不僅僅是提供被動的回應,而是能夠主動預測並滿足客戶需求,從而將服務體驗提升到一個全新的層次。
代理式 AI 的核心功能:
- 預測性服務:代理式 AI 能分析用戶在樂天生態系中的行為模式,例如購物、金融和通訊數據,從而在用戶提出需求之前,就先預測他們可能需要的服務或產品。
- 跨生態系協作:這些 AI 代理能夠無縫地串聯樂天旗下的多個服務,例如當用戶在樂天市場購物時,AI 代理可以同時考慮其樂天銀行或樂天旅行的資料,提供更為個人化且完整的建議。
- 提升員工效率:代理式 AI 不僅服務客戶,也作為員工的智慧助手,自動化重複性任務,如數據分析、內容創建和客戶服務管理,讓員工能專注於更具戰略性的工作。
技術能力:從基礎研究到開源貢獻
樂天AI的技術實力建立在全球化的研發網絡(Rakuten Institute of Technology, RIT)之上,並積極將其成果回饋給開源社群。
- 大型語言模型(LLMs):樂天不僅開發了專為內部優化的生成式AI平台,也將其成果開放。例如,在 Hugging Face 平台上,樂天釋出了
RakutenAI-2.0-8x7B-instruct
這個模型 (huggingface.co/Rakuten/RakutenAI-2.0-8x7B-instruct)。從模型名稱中的8x7B
可以看出,這是一個採用**混合專家模型(Mixture-of-Experts, MoE)**架構的指令微調模型,展現了樂天在模型架構上的專業技術。 - 代理式生態系統(Agentic Ecosystem):樂天AI的願景是建立一個由AI代理組成的生態系統。根據其介紹,他們利用如 LangGraph 等工具來驅動代理工作流,讓員工能以最少的程式碼創建並分享AI代理。這不僅加速了新功能的開發,也讓AI技術能更快速地被應用於業務流程中。
- 多模態互動:樂天AI 支援多種輸入方式,包括文字聊天、語音轉文字與影像辨識,讓用戶能以最自然的方式與服務互動。
核心架構:混合專家模型 (MoE)
Rakuten AI 2.0 最引人注目的特點是採用了先進的 Mixture of Experts (MoE) 架構。這項技術的實作細節如下:
- 模型規模與活躍參數:
RakutenAI-2.0-8x7B-instruct
這個名稱本身就揭示了其架構:它由 **8 個各自擁有 70 億參數的「專家」組成。這使得模型的總參數數量達到 470 億(8 x 7B),但其活躍參數(Active Parameters)**在每次推論時僅為 130 億左右。 - 路由機制(Router):當處理一個輸入 Token 時,一個稱為 Router 的路由網路會判斷該 Token 的性質,並精準地將其分配給兩個最相關的專家進行運算。這種選擇性的啟動,使得模型在保持極大知識儲備的同時,其推論所需的運算量(FLOPS)與一個 130 億參數的稠密模型相當,大幅提升了運算效率。
- 效能與效率的平衡:與傳統的 470 億稠密模型相比,MoE 架構在推論時能消耗大約 4 倍少的運算資源,但效能卻能與之匹敵。這使得 Rakuten AI 2.0 能夠在更具成本效益的硬體上運行,實現高效能與低延遲的平衡。
訓練與微調:日語優化與對齊
Rakuten AI 強大效能,源於其精心的訓練與微調流程。
- 基礎模型訓練:該模型基於 Mistral-7B 模型的架構,並在其基礎上,利用樂天內部的高品質日語和英語資料集進行持續訓練。這個資料集經過多階段的清洗、去重和過濾,確保了訓練數據的優良品質。
- Tokenization 優化:為了克服 Mistral 原生分詞器在處理日語漢字時效率低下的問題,樂天將詞彙表(Vocabulary)從 32k 擴展到 48k,並增加了專為日語設計的 Token。這使得日語文本能以更少的 Token 進行編碼,從而提升了有效上下文長度與運算效率。
- 指令微調(Instruction Fine-tuning):
RakutenAI-2.0-8x7B-instruct
版本是透過指令微調和**偏好優化(Preference Optimization)**技術訓練而成。樂天採用了名為 SimPO (Simple Preference Optimization) 的新技術,它是一種相較於傳統 RLHF (人類回饋強化學習) 更簡單、穩定且高效的對齊方法,使得模型能更好地遵循人類指令並產生更符合預期的回應。
性能表現與應用場景
Rakuten AI 2.0 在多項基準測試中展現了其頂尖的競爭力。
- 日語基準測試:該模型在衡量日語對話與指令遵循能力的 Japanese MT-Bench 基準測試中,取得了在 13B 活躍參數級別中名列前茅的成績。其在日語性能上的顯著提升,使其在處理樂天生態系中複雜的日語任務時,表現尤為出色。
- 應用價值:作為一個性能優異且運算高效的模型,Rakuten AI 2.0 不僅被用於樂天內部的多項服務,從電商推薦到金融風控,同時也作為開源模型釋出,賦能廣大的開發者社群,推動日語 AI 應用的創新。

跨領域應用:串聯電商、金融與通訊
樂天AI的獨特之處在於其廣泛的應用場景,能夠在樂天龐大的生態系中發揮綜效。
- 電子商務:在樂天市場(Rakuten Ichiba),AI 透過分析用戶的購買歷史與偏好,提供高度個人化的商品推薦。用戶也能使用自然語言或圖像來進行搜尋,獲得更精準的購物建議。
- 金融科技(Fintech):AI 技術被用於開發信用評分與風險評估模型,提升樂天銀行與樂天證券等金融服務的營運效率與安全性。
- 行動通訊:樂天移動(Rakuten Mobile)利用 AI 實現網路的自動化管理與優化,同時也將生成式 AI 服務整合到其企業解決方案中,協助企業客戶提升辦公效率。
結論:以AI驅動的全球創新者
樂天AI 的策略,不僅是為其現有業務增添新功能,更是透過將 AI 作為核心驅動力,來重塑整個生態系統。從開源發布的 MoE 模型到前瞻性的 AI 代理生態系,樂天AI 正以其獨特的方式,將技術創新、服務精神與社會責任融為一體,目標是成為一個能夠賦能全球數十億用戶的創新領導者。
*以上文章部份為AI產生內容,無商業用途。