亚洲午夜精品国产电影在线观看,无码人妻一区二区三区四区av,亚洲中文字幕无码乱线久久视

首頁

職位 ?·? 推薦

名企

校園 ?·? 招聘會

視頻升值 App

我要求職我要招聘

刷新時間：2025-10-30

Agent RL 算法研究員（LLM） 6-8K 參考工資

山東省青島市市南區? | ?應屆畢業生?| ?碩士? | ?年齡不限? | ?招2人? | ?校招

五險一金年終獎全勤獎節日福利雙休健康體檢通訊補貼提供住宿餐補/工作餐

...

專業要求

應用經濟學

數學

物理學

統計學

信息與通信工程

控制科學與工程

計算機科學與技術

網絡空間安全

軟件工程

薪資詳情

發放方式：每月15日?????

崗位職責

1. RL-enhanced LLM Agent：結合強化學習環境，構建具備記憶、反思、規劃、自進化及工具調用能力的類人智能體。
2. Multi-Agent systems：研究多個智能體如何高效協作，以完成超越單個智能體能力范圍的任務。
3. Omni-LLM-based Agent：開發融合文本、語音、圖像多模態的智能體。
4. World Model：探索AI系統如何構建自身與外部世界的認知與期望模型。
5. 數據迭代流程優化：深入理解數據需求，推動人機協同的數據迭代流程，實現從人工到半自動化再到自動化的轉變。

崗位要求

1. 教育背景：高校研究生在讀，具備良好的計算機或數學基礎，擁有較強的編碼能力。
2. 技術背景：具有LLM（大語言模型）、強化學習、推理模型等相關背景，熟悉主流大語言模型的算法架構。
3. 對齊方法：了解Alignment領域的常用方法，包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求：具備卓越的實驗分析與問題解決能力，擁有創新思維，能夠進行良好的溝通，并與團隊成員高效協作。
【加分項】
1. 深度學習基礎：具備深度學習、機器學習的基礎知識，熟悉有監督學習、自監督學習等基本訓練范式。
2. 項目經驗：在大語言模型方面有開源項目經驗者優先，或曾通過機器學習算法解決過復雜問題。特別歡迎跨界研究者。
3. 競賽獎項：在 ACM/ICPC、NOI/IOI、Kaggle 等編程/AI 比賽獲獎者優先。
4. 學術成果： ICML、ICLR、NeurIPS、ACL、CVPR 等頂級學術會議發表過有影響力研究成果的優先。

工作地址

山東省青島市市南區·香港中路26號遠雄國際廣場909室

HR信息