爰上碰23在线视频,四虎国产精品永久地址99,久久精品国产精品国产精品污

首頁

職位 ?·? 推薦

名企

校園 ?·? 招聘會

視頻升值 App

我要求職我要招聘

刷新時間：2025-10-30

RL金融量化算法工程師 12-20K 參考工資

山東省青島市市南區? | ?1-2年?| ?碩士? | ?年齡不限? | ?招3~5人? | ?全職

五險一金年終獎全勤獎節日福利雙休健康體檢通訊補貼提供住宿餐補/工作餐

...

崗位職責

AttentionLSTMPythonTransformer視覺圖像算法推薦算法智慧金融自然語言處理

1、持續優化開源RL量化模型，能夠根據實際優化目標確定方案，并且在強化學習各類方法中持續迭代。
2、負責深度強化學習（DRL）算法的研究、設計與工程實現，涵蓋單智能體與多智能體場景；
3、開發并迭代經典與前沿算法（如 DQN、PPO、SAC、TD3、A3C、MAPPO 等），提升樣本效率與收斂速度；
4、搭建端到端訓練與評估量化交易的流水線，包括環境接口封裝、數據采集、指標監控與超參調優；
5、設計能夠在模擬量化交易和真實交易場景中進行算法驗證與性能優化；

崗位要求

1、計算機相關專業碩士及以上學歷
2、熟練掌握大模型continue pretrain, SFT, RLHF等優化模型方法，能夠獨立開展相關研發工作，有大模型RL agent應用落地經驗者優先;
3、持續跟蹤RL領域的最新進展，并結合自身業務能提出見解，拓展業務邊界;
4、扎實的代碼功底和工程開發能力，精通Linux 平合下的C++/Python 語言開發，熟練掌握 llama-factory，verl等訓練框架；對AGNET-TARS, Camel等agent框架有深入理解;
5、目標感強，善于分析和發現問題，拆解簡化，有較好的溝通和推動能力;
6、優先考慮在 ACL、 EMNLP、NAACL、 NeurlPS、 ICLR、ICML 等會議發表論文的候選人。
7、ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比賽獲獎者優先。

工作地址

山東省青島市市南區·香港中路26號遠雄國際廣場909室

HR信息