崗位職責:
1、負責網頁信息抽取技術的研究和開發(fā);
2、負責爬蟲各個系統(tǒng)核心代碼開發(fā);
3、提高數(shù)據(jù)抓取的效率和質量,解決數(shù)據(jù)的重復,垃圾數(shù)據(jù)識別,清洗;
4、提高系統(tǒng)的可運維,可測性,易用性。
任職要求:
1、3年以上python或java開發(fā)經驗;
2、熟悉MYSQL,MSSQL,具備sql調優(yōu)經驗;
3、了解爬蟲的設計及實現(xiàn)流程;
4、了解HTML基礎知識;
5、具備團隊協(xié)作精神;
6、了解文本分類,統(tǒng)計分析,自然語言處理,機器學習算法,熟悉前端技術和分布式計算,有分布式存儲經驗者優(yōu)先。
聯(lián)系我時,請說是在吉安人事人才網上看到的,謝謝!