發放方式:每月15日?????
1. RL-enhanced LLM Agent:結合強化學習環境,構建具備記憶、反思、規劃、自進化及工具調用能力的類人智能體。
2. Multi-Agent systems:研究多個智能體如何高效協作,以完成超越單個智能體能力范圍的任務。
3. Omni-LLM-based Agent:開發融合文本、語音、圖像多模態的智能體。
4. World Model:探索AI系統如何構建自身與外部世界的認知與期望模型。
5. 數據迭代流程優化:深入理解數據需求,推動人機協同的數據迭代流程,實現從人工到半自動化再到自動化的轉變。
1. 教育背景:高校研究生在讀,具備良好的計算機或數學基礎,擁有較強的編碼能力。
2. 技術背景:具有LLM(大語言模型)、強化學習、推理模型等相關背景,熟悉主流大語言模型的算法架構。
3. 對齊方法:了解Alignment領域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求:具備卓越的實驗分析與問題解決能力,擁有創新思維,能夠進行良好的溝通,并與團隊成員高效協作。
【加分項】
1. 深度學習基礎:具備深度學習、機器學習的基礎知識,熟悉有監督學習、自監督學習等基本訓練范式。
2. 項目經驗:在大語言模型方面有開源項目經驗者優先,或曾通過機器學習算法解決過復雜問題。特別歡迎跨界研究者。
3. 競賽獎項:在 ACM/ICPC、NOI/IOI、Kaggle 等編程/AI 比賽獲獎者優先。
4. 學術成果: ICML、ICLR、NeurIPS、ACL、CVPR 等頂級學術會議發表過有影響力研究成果的優先。
在求職過程中如果遇到扣押證件、收取押金、提供擔保、強迫入股集資、解凍資金、詐騙傳銷、求職歧視、黑中介、人身攻擊、惡意騷擾、惡意營銷、虛假宣傳或其他違法違規行為。請及時保留證據,立即向平臺舉報投訴,必要時可以報警、起訴,維護自己的合法權益。
