Flink / データサイエンティスト
配達員の行動データの不審な記録を検出、より適切な配達効率を推定。
Flinkでは配達員がアプリの操作により配達完了時刻などを記録し、そのデータに基づいて平均配達所要時間などの評価を行います。ここから一人当たり時間あたりの配達数の目安が計算され(UTR: Rider Utilization Rate)、さらにこの指標がモデルによる注文数の予測から適切な配達員数を推定する際に用いられます。そのためこうした時刻データは非常に重要ですが、ハブによっては配達員達がマネージャーから目標の時間以内に配達するようプレッシャーをかけられて、実際に配達を終える前に完了のタイムスタンプを押してしまうことが頻発していました。これはUTRの過大評価につながり、配達員の不足を招きます。また逆に配達員が完了のタイムスタンプを押し忘れて配達所要時間が過大評価されていることもあります。このプロジェクトでは、こうした不審なデータをGPSによる配達員の各時刻の位置情報を使って発見し、Google Mapsの推定所要時間を使ったLinear Regressionによる推定によって置き換えました。これにより目標UTRが修正され、いくつかのハブのパフォーマンスが改善されました。