職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位職責:
1、負責公司核心業務數據的爬取、清洗、標注、審核與編輯工作;
2、使用爬蟲工具高效獲取目標數據,并進行數據整理和標注,用于訓練 AI 模型;
3、對模型輸出的數據進行審核和編輯修改,確保數據的準確性和可用性;
4、集中進行數據審核與編輯修改,確保數據數量與質量滿足項目需求;
5、配合 AI 團隊進行模型測試、prompt 優化、數據集構建等工作;
6、理解人工智能和大模型訓練的語料需求,進行語料搜集和整理;
7、對收集到的原始數據進行初步篩選、格式標準化和文本標注,為模型訓練提供高質量數據。
任職要求:
1、本科及以上學歷,計算機科學、電子信息、自動化等相關專業;
2、熟練掌握 Python 等編程語言,具備扎實的編程基礎;
3、熟練運用爬蟲工具,能夠高效獲取目標數據;
4、了解數據清洗、標注、審核等數據處理流程,并具備相關項目經驗;
5、對人工智能和大模型訓練有基本了解,能夠理解語料需求和進行數據整理;
6、具備較強的數據敏感性,能夠發現數據中的問題和規律。
1、負責公司核心業務數據的爬取、清洗、標注、審核與編輯工作;
2、使用爬蟲工具高效獲取目標數據,并進行數據整理和標注,用于訓練 AI 模型;
3、對模型輸出的數據進行審核和編輯修改,確保數據的準確性和可用性;
4、集中進行數據審核與編輯修改,確保數據數量與質量滿足項目需求;
5、配合 AI 團隊進行模型測試、prompt 優化、數據集構建等工作;
6、理解人工智能和大模型訓練的語料需求,進行語料搜集和整理;
7、對收集到的原始數據進行初步篩選、格式標準化和文本標注,為模型訓練提供高質量數據。
任職要求:
1、本科及以上學歷,計算機科學、電子信息、自動化等相關專業;
2、熟練掌握 Python 等編程語言,具備扎實的編程基礎;
3、熟練運用爬蟲工具,能夠高效獲取目標數據;
4、了解數據清洗、標注、審核等數據處理流程,并具備相關項目經驗;
5、對人工智能和大模型訓練有基本了解,能夠理解語料需求和進行數據整理;
6、具備較強的數據敏感性,能夠發現數據中的問題和規律。
工作地點
地址:南京雨花臺區嘉環大廈


職位發布者
嘉環科技..HR
嘉環科技股份有限公司

-
通信/電信/網絡設備/增值服務
-
1000人以上
-
股份制企業
-
金筆街27號