横地悠紀

製造業支援サービス自社開発企業 / AIエンジニア北海道

ログインしてつながる

横地悠紀

製造業支援サービス自社開発企業 / AIエンジニア

ログインしてつながる

自己紹介

札幌出身札幌在住のAIエンジニア・データサイエンティストです。 AIやデータ分析の各分野との親和性の高さや、ビジネスにおける課題解決の最適解として選択されやすい点に将来性を感じながら日々業務に励んでおります。

この先やってみたいこと

未来

今後も引き続きAIを活用したサービスやプロダクトの開発にデータサイエンティストとして携わっていきたいと考えています。起業した会社事業の企画・運用の経験と技術力を結び付けることで、より一気通貫に事業を成功へ導くマクロな視点を持った人材になることを目指しております。

製造業支援サービス自社開発企業2ヶ月

AIエンジニア（副業）現在

2024年2月 - 現在

文書画像からテキスト情報を抽出するAIの開発およびチューニング

文書画像認識モデルを用いた決算書情報抽出AIのチューニング
◼︎前提・課題社内DX化の一環として、決算書(BSとPL)からの情報抽出の自動化を目的とするプロジェクトが発足し参画。決算書の画像内にある文字を抽出しjsonデータ化するために、OCRフリーの文書画像認識モデルである「Donut」が選択されたが、参画当時のF1スコアは68.6%であった。このDonutモデルをチューニングし、実運用へ向けてF1スコアを向上させる。 ◼︎業務内容 Donutモデルに対して以下のチューニング施策を提案および実装を行うことで、F1スコアを92.0%まで向上させた。 - モデルが未学習の漢字のうち決算書中に頻出の漢字を強化学習した。 - 隣接するテキストが誤って統合され誤認識となる問題を解決するために、 - モデルが生成するクロスアテンションヒートマップに基づく各テキストに対応するバウンディングボックス座標を定義。各バウンディングボックス間のIoU(重なり度合い)から、ルールベースで誤って統合されたテキストを分割した。 - エンコーダの構成とパラメータを調整し、モデルが画像内の小さなテキストや細かい文章特徴により注目できるようにした。 - 文字の小さい複雑なテキストの認識精度向上のために、 - 入力画像データセットの解像度を2倍に引き上げた。それに伴う入力の設定値変更や節GPUメモリを行うためのコード改修を実施した。 - 文書画像のノイズ除去、2値化、グレースケール化などの前処理を施した。 - trainフェーズのみに、データ拡張を行い一般化能力を向上させた。 - ハイパーパラメータの最適化を行った。
2024年2月 - 2024年4月

Webサービス自社開発企業3ヶ月

AI開発チーム-AIエンジニア(テックリード)現在

2024年1月 - 現在

利用ユーザー確保・運用のコストカットを目指したAI開発＆データ分析業務

自社サービス集客のSNS集客AI開発
(Under construction...)
2024年1月

ITコンサル企業6ヶ月

機械学習エンジニア・データサイエンティスト(副業)現在

2023年10月 - 現在

データ分析/AI開発を用いたコンサル事業およびサービス開発

LLMを用いた契約促進&解約阻止用チャットボットの遷移図生成
大規模言語モデル（LLM）の進展により、テキスト生成や画像生成など多様なタスクに応用することが可能になっている。一方で、企業にとって契約促進や解約阻止は重要な要素となるが、これらを強化したり効率化・自動化する直接的なLLM利用方法はまだ存在していない。この課題に対処するため、LLMの進展を活かして、ユーザーの質問や問い合わせに適切に対応するためのチャットボットやコールセンターのトークスクリプトを自動生成することに焦点を当てる。 Webサイトのリンクやサービスに関する資料をインプットとして、契約促進&解約阻止用のシナリオごとのトークスクリプトを遷移図形式で出力できるようなWebサービスを開発することをゴールとした。まず、サービスのHPスクレイピングや提供された資料(テキスト形式)によって得られた情報に対し、解約阻止および契約促進に役立つ情報を特に残すよう要約するChatGPT-4のプロンプトとプログラムを作成した。続いて、要約した内容を基に、ユーザーの想定される質問に対して担当者（チャットボット）の模範的な回答を出力できるようにした。さらに、ユーザーがそれに共感したか否かに応じた担当者の返答を、要約した内容を基に適切なリンクと共に提供できるようにした。このように、契約促進&解約阻止用のシナリオごとのトークスクリプトを遷移図形式で段階的に完成させるプロンプト&プログラムを作成した。これにより、解約を検討しているユーザーには、リンクをクリックすることで解約の問い合わせから離脱し、再考する機会を自然に提供する仕組みを構築した。また、契約を検討しているユーザーには、その意思決定を支援するための情報に効率的にアクセスできるシステムを完成させた。
2023年10月

株式会社トキワシステム2年間

取締役現在

2022年4月 - 現在

不動産業(海外)

アドプラットフォーム自社開発企業2年間

データサイエンティスト・アプリケーションエンジニア(正社員)

2022年4月 - 2023年12月

自社サービスのユーザーに対するデータ分析・自社サービス開発

自社サービスの改善/運用業務
弊社OW型広告プラットフォームにおいて、ABテストを通じて獲得した全てのオファーウォール案件の最適化、サービスの全体デザインの調整・コードのvue2->vue3移行を担当。また、利用メディアの新規導入作業をはじめとするサービス運用対応および障害対応を担当した。
2023年4月 - 2023年12月
年代別検証結果のデータ分析
弊社OW利用某メディアでのABテストで、ユーザーの年代に最適化した案件掲載順(A)が売上で優勢だった。BigQuery上のデータをSQLで集計・整形し、結果をLooker Studioで可視化。Aの勝因は各年代が好む高単価案件を適切に上位表示し、売上に影響するコンバージョンを獲得したことと報告した。
2023年3月 - 2023年4月
ファネル/コホート分析可視化ツールの移植開発
使いにくいRedashのファネル分析・コホート分析可視化ツールを、使いやすいStreamlitツールに移植。集計期間やユーザー属性に基づいてデータを取得・変形し、絞り込みの二重フォームを実装してデータ取得コストを削減。図やヒートマップでデータを直感的に表現した。UIは改善し、絞り込み機能の不具合は解消。データ分析実例を用いたツール説明会を主催し、社内でのStreamlitへの移行が定着した。
2023年1月 - 2023年3月

外資系OTTサービス運営企業1年間

機械学習エンジニア（副業）

2022年7月 - 2023年10月

分類系AIモデル構築

分類AIシステムの改善施策
2023年5月完成の映画ニュース記事分類モデルおよび同年10月完成のエンタメニュース記事分類モデルそれぞれに対し、公開日・記事テキスト&アイキャッチ画像の類似度を根拠に同一トピックと判定された記事同士に、同一ラベルを付与する仕組みを現在のシステムで導入していた。しかし、運用する中で全く関連しない記事が同一トピックとされる事例が発生したためシステム改善を行った。また、近年の大規模言語モデル(LLM)の進歩から、ニュース記事分類タスクをより高精度かつ低コストに実行できる可能性が将来的に想定されるため、その移行に向けた調査を進めた。 ■同一トピック判定人名、施設名、地名などの固有名詞が記事テキスト内に共通して出現している場合、記事の類似度が高くなるように調整する事で不具合は解消。同一トピックを同一と判定できる確率(再現率)は90.7%から94.2%へ、同一と判定したものが正しかった確率(適合率)は94.7%から96.6%へ向上した。 ■大規模言語モデル(LLM)への移行可能性の調査当時最新のLLM調査結果により、同一トピック判定処理内のアイキャッチ画像の類似度計算部分を、GPT-4 vによる分析へ差し替えた。また、分類済の記事に2023年12月時点のPaLM2(Google)を用いたフィードバックを設置し、付与されたラベルの間違いを改善する手続きを追加した。 80%のラインであった再現率適合率が、今回の改善で再現率に大きな向上はないものの適合率はいずれも90%以上を達成した。また、運用コストは改善前の1.14倍まで抑えることができた。
2023年8月 - 2023年10月
エンタメニュース記事のメディア形態分類
運用が困難だったエンタメニュースのタグ付けを改善するため、GPT-4と機械学習モデルを組み合わせた新システムを実装した。まず、人間によるアノテーションを行い、次にGPT-4を使って効率的なプロンプトを設計。しかし、予算上の問題でGPT-4はアノテーターとして利用し、アノテーションされた記事をLightGBMモデルの教師データとした。記事数を増やし、データの不均衡をRandomOverSamplerで対応。Sentence-BERTモデルとのアンサンブル学習を行い、全ラベル平均の再現率を0.56->0.86へ。適合率を 0.45->0.80へ向上させ、AIアプリとしての性能改善に貢献した。
2023年5月 - 2023年10月
映画ニュース記事分類精度の向上
映画ニュースメディアの自動タグ付けを目指し、約30000の映画記事を教師データとする、LightGBMとSentence-BERTによるアンサンブルモデルを作成。しかし6つのカテゴリーでf1値が0.02未満と低く、これらカテゴリーがデータ不均衡であることが問題と特定。対策として、未アノテーションの映画記事から2000件をランダムに抽出しアノテーション、適合率特化型LightGBMモデルとキーワード検索を用いて陽性データの抽出・追加を行った。次にアンサンブル手法を改良しSentence-BERTモデルの誤判定を補正。これによりf1値は平均0.78に向上。さらに、公開日とアイキャッチ画像を用いて記事の類似度を計算し、同一トピックを持つ記事をグループ化。これにより同一トピックには同じラベルが付与され、精度は再現率90.7%、適合率94.7%に。さらに、ChatGPTを用いてプロンプトフォーマットを整備し、テキストから31個の記事カテゴリーラベルを判定するタスクを行えるように。再現率・適合率いずれも約80%の精度でラベル付が可能となった。最終的には、各記事カテゴリーラベルの陰性陽性を判定するモデルを統合し、再現率84%、適合率86%の精度を実現。完成したモデルを適用させ、AIアプリとしての精度改善に貢献した。
2022年7月 - 2023年5月

トヨタ自動車6ヶ月

データサイエンティスト（副業）

2022年8月 - 2023年1月

自然言語処理を用いたデータ分析

セールスガイドAI開発
自動車営業の音声と文字データを分析し、営業の成功率向上を目指した。日本語Sentence-BERTを用いて文ベクトル化し、クラスタリングで文章を分類。その後、ラベル付きテキストデータでMLPClassifierによる訓練を行い、96.0%の正解率を達成。さらにAmivoiceでの分析から10個の特徴量を抽出し、営業マンの話し方の特徴を定量化した。この結果を用いて、営業の成功・失敗理由の自動フィードバックを支援した。
2022年7月 - 2023年1月

東京大学大学院修士課程2年間

工学系研究科

2020年4月 - 2022年3月

深層学習を用いた盗取検知手法の提案および実装 (姿勢推定/動作推定/物体検出/時系列予測/パターン認識)

最優秀賞受賞(第42回日本核物質管理学会)
2021年11月
優秀賞受賞(第17回日本保全学会)
2021年7月
東京大学GCL
東京大学の9研究科17専攻の分野横断型研究で社会イノベーションを起こすGCLプログラム
2020年9月 - 2021年3月
盗取検知AI開発(学会最優秀賞作品)
2021年1月

株式会社バーナイン2年間

取締役CTO(創業者)

2020年7月 - 2021年12月

受託開発およびスクール事業の企画・運用

サービス業/顧客データ分析・行動予測のコンサルティング
サービスを退会する理由や退会直前の顧客の行動の分析を行い、直近で退会する可能性の高い顧客を特定。また、その顧客へのアクション内容の提案。クライアントへのヒアリング、データ分析、分析レポート作成を担当。
2021年8月
製造業/最適な輸送ルートのコンサルティング
製造から物流までの全体の流れにおけるコスト改善策の提案。およびSNSにおける人間関係ネットワークや口コミ情報に基づいた商品売上の予測。クライアントへのヒアリング、データ分析、分析レポート作成を担当。
2021年7月
飲食業/料理注文システム開発
飲食店における料理の販売情報の管理、デリバリー申し込み、決済を行うシステムの開発。クライアントへのヒアリング・仕様書作成、ユーザーインターフェイス設計、プログラムコーディング、進行管理、ディレクションを担当
2021年3月 - 2021年6月
サービス業/購買管理システム開発
商品プランのショッピング機能を持ち、予約、決済を行うシステムの開発。クライアントへのヒアリング・仕様書作成、ユーザーインターフェイス設計、プログラムコーディングを担当。
2021年1月 - 2021年2月

個人事業3年間

フロントエンド/ バックエンドエンジニア（副業）

2018年3月 - 2020年6月

Webサイト制作 Webアプリ開発

首都大学東京(現東京都立大学)4年間

放射線学科

2016年4月 - 2020年3月

放射線測定機器放射線物理シミュレーション放射線生物シミュレーション医療画像再構成技術など

スキルと特徴

機械学習
0
データサイエンス
0
Web開発
0
Webマーケティング
0
事業開発
0

実績

受賞と資格

言語

英語 - ビジネス会話レベル

横地さんと関連する人々

アプリをインストールして、知り合いの最新の活躍をフォローしよう

Peopleアプリで見る

横地 悠紀

横地 悠紀

自己紹介

この先やってみたいこと

製造業支援サービス自社開発企業2ヶ月

AIエンジニア（副業）現在

Webサービス自社開発企業3ヶ月

AI開発チーム-AIエンジニア(テックリード)現在

ITコンサル企業6ヶ月

機械学習エンジニア・データサイエンティスト(副業)現在

株式会社トキワシステム2年間

取締役現在

アドプラットフォーム自社開発企業2年間

データサイエンティスト・アプリケーションエンジニア(正社員)

外資系OTTサービス運営企業1年間

機械学習エンジニア（副業）

トヨタ自動車6ヶ月

データサイエンティスト（副業）

東京大学大学院修士課程2年間

工学系研究科

株式会社バーナイン2年間

取締役CTO(創業者)

個人事業3年間

フロントエンド/ バックエンドエンジニア（副業）

首都大学東京(現東京都立大学)4年間

放射線学科

スキルと特徴

実績

受賞と資格

言語

横地さんと関連する人々

横地悠紀

横地悠紀