●担当業務内容
AI検索サービスの根幹となるデータアーキテクチャの設計、およびデータ管理プロセスの最適化・自動化をリードします。
[1] AIモデルのためのデータ基盤構築・パイプライン設計:50%
AI/MLモデルの学習・推論に必要なデータを、高品質かつタイムリーに供給するための基盤を作ります。
データ収集・加工:多様なログデータや商品データを収集し、モデルが学習可能な形式へ加工(ETL/ELT)するパイプラインの設計・構築
特徴量管理(Feature Store):特徴量の作成・管理を一元化し、学習時と推論時のデータ不整合(Training-Serving Skew)を防ぐ仕組みの導入
データ品質管理:データの欠損や異常を検知し、常にクリーンなデータを維持するための監視・通知システムの構築
[2] データ管理プロセスの最適化および自動化推進:30%
属人化しがちなデータ抽出・加工作業を排除し、自動化されたワークフローを確立します。
データ運用の自動化:手動SQLやスクリプトに依存しているデータ作成フローを、Workflow Engine(Airflow等)を用いて自動化・コード化(IaC)
MLOps基盤の強化:データサイエンティストがスムーズにモデル実験・デプロイを行えるよう、インフラ側からの環境整備
メタデータ管理:どのデータがどこにあり、どう加工されたかを追跡可能にするデータカタログの整備
[3] チームマネジメント・戦略策定:20%
セクションリーダーとしてメンバー(正社員・パートナー)のタスク管理、技術指導、評価
事業目標に基づいた中長期的なデータ戦略・アーキテクチャロードマップの策定
●仕事のやりがい(面白さ)
単にデータを溜める箱を作るのではなく、「AIを賢くするためのデータ戦略」を技術面からリードできるポジションです。
3000万点の商品データと年間1億件の検索ログという膨大な資産を使い、いかに効率よく特徴量を作り出し、モデルに供給するか。この「データエンジニアリング×MLOps」の領域において、ゼロベースで設計し、プロセスの自動化まで裁量を持って推進できる点は、エンジニアとして大きな醍醐味です。
●3~5年後の想定されるキャリアパス
AI/データ基盤のスペシャリストとして、全社のデータ戦略を担うデータアーキテクト
データエンジニアリング組織を統括するマネージャー
MLOps領域を極め、開発と運用の架け橋となるテックリード
●業務上の課題
AI活用の高度化に伴い、データ加工や特徴量作成のプロセスが複雑化しており、一部のエンジニアによる手動対応や属人化した運用がボトルネックになっています。
データサイエンティストがモデル開発に専念できるよう、データ準備にかかる時間を極小化し、システムによる自動化・最適化を強力に推進することが急務です。
●使用ツール
クラウド・インフラ: Google Cloud Platform (GCP)を主軸にAWSとハイブリッド構成
AI/MLプラットフォーム: Vertex AI (Pipelines, Feature Store, Model Registry)
データウェアハウス・加工: BigQuery, Dataform, Redshift
コンテナ・サーバレス: GKE (Google Kubernetes Engine), Cloud Run, Cloud Functions
IaC・CI/CD : Terraform, GitHub Actions
言語: Python, SQL
コミュニケーション・管理: MS Teams, GitHub Projects , GitHub Issues
●その他
リモートワークと出社のハイブリッド勤務、フリーアドレス制など、柔軟で働きやすい環境です。
1必須要件いずれもの条件を満たす方
大規模データの収集・蓄積・加工(ETL/ELT)基盤の設計・構築経験
Python/SQLを用いたデータ処理の実務経験
AWS/GCP等のパブリッククラウドを活用したデータパイプラインの構築経験
開発チームのリーダーまたはマネジメント経験(進捗管理・技術指導含む)
2歓迎要件
<経験>
GCP (BigQuery, Vertex AI等)を活用したデータパイプラインおよびMLOps基盤の構築経験
Dataformまたはdbtを用いたデータモデリング・ELT処理の開発経験
OpenMetadataやDataHub等のツールを用いたデータカタログ・データガバナンス基盤の導入・運用経験
機械学習モデルのライフサイクル管理(実験管理、モデルデプロイ、監視)の自動化経験
<知識・スキル>
モダンデータスタック(Modern Data Stack)に関する最新の知見
データ品質(Data Quality)やデータリネージの可視化に関する知識
Infrastructure as Code (Terraform)によるGCPインフラ管理スキル
ビジネスレベルの英語力(ドキュメント読解等)
3求める人物像
「データはAIの燃料である」と理解し、その燃料をいかに効率よく、高品質に供給し続けるかに情熱を持てる方。
現状の泥臭いデータ加工作業を「仕方ない」と諦めず、「どうすれば自動化できるか?」「どうすればプロセスを最適化できるか?」を常に考え、チームを巻き込んで改善を実行できるリーダーシップを持った方を求めています。
4学歴
大学院卒、大学卒、高専卒、専門卒以上
勤務時間
9:00~17:30(標準7時間30分)
※フレックスタイム制あり/コアタイム11:00~15:00
働き方
1勤務制度区分
<フレックスタイム制>
2リモートワーク勤務
<リモート可>
3出社頻度
週2日
4土日祝出勤
・有無<無し>
5出張情報(有無/場所/頻度)
・有無<無し>
6兼業に関して
・原則不可
年間休日124日
完全週休2日制、年末年始、有給休暇(勤続年数に応じて付与、入社初年度は10日間)、慶弔休暇、特別休暇
■産前産後休暇:産前6週間(多胎妊娠の場合は14週間)、産後8週間
■育児休業(入社1年以上):原則子供が1歳に達するまで、最長2歳に達するまで取得することができます。男性社員の場合、出生時育児休業も取得可能
■育児時短勤務(入社1年以上):最長、子供が小学校4年生修了時まで
■子の看護休暇:小学生未満の子供が負傷し、または疫病にかかった場合、年間5日(子供が2人以上の場合は10日)まで
1日、半日、1時間単位で取得可能
■有給休暇:1日、半日、1時間単位で取得可能
試用期間:有(試用期間:原則3ヶ月) ※試用期間中の待遇変更はありません
昇給:年1回(4月)
※業績賞与制度あり
各種社会保険完備
【東証プライム上場 有名電機メーカーグループ】 技術系総合職
【東証プライム上場 日本を代表する総合重工業メーカー】 社内SE(クラウドサービス基盤の構築・運用を担うインフラエンジニア)
【東証プライム上場 完成車メーカー】 プロダクト企画部 デジタルプロダクト開発における商品企画・プロダクトマネジメント
人々の生活や命を支えるため、「食料・水・環境」分野で地域に根ざした事業にチャレンジする
「LINE」ならではのビッグデータ分析から、これまでにないスコアリングモデルを開発。ユーザー志向の金融サービスを形にします。
子どもたちに愛され続け、進化するおもちゃたちが、日本から世界へ、新しい夢と感動を広げています。
世界に向かうデジタルビジネスのパートナーとして、売上拡大とコスト最適化を支援しています。
世界の食料生産とエネルギー変換の分野で、ディーゼルエンジンの用途を広げています。
エネルギー、インフラ、ストレージ。3つの注力事業において、新しい人材が 「新生東芝」 を動かし始めています。