■概要
・社内に蓄積された非構造化データ(テキスト、ログ、画像、音声など)を収集・分析し、構造化プロセスを経て、生成AIやRAGシステム、AIエージェントに適用可能な形に変換する役割を担います。
・最先端のAI技術を持ちいて自社データの価値を最大化し、業務の効率化や新価値創出に寄与するポジションです。
・他部署との連携(データサイエンス、システム開発、業務部門等)を通して、データの価値最大化を目指します。
■具体的な例
##非構造化データの解析と前処理
・テキスト、画像、音声等の非構造化データの抽出、クレンジング、正規化、メタデータの付与
・NLPや画像解析、音声解析の技術を活用し、データの意味抽出や分類、タグ付けを実施
・検索精度を向上させるための、ドキュメントパース/チャンキング処理を実施
##データ連携の設計
・RAG(Retrieval-Augmented Generation)システム、AIエージェントシステムとデータを連携するためのインタフェース設計
・自然言語UIによる対話的クエリ実行処理の検討
##RAG(Retrieval-Augmented Generation)システムにおける検索処理最適化
・構造化データと非構造化データのハイブリッド利用による情報検索基盤の開発・導入検討
・ベクトルDBやグラフDB活用による検索のためのデータ構造及びインデキシングの最適化
・マルチモーダルデータ基盤の導入企画
■利用技術
・プログラミング言語:Python、SQL等
・データ処理・分析:Pandas、NumPy、Spark等
・自然言語処理(NLP):BART, Transformers, mecab等
・機械学習/ディープラーニングフレームワーク:TensorFlow、PyTorch、scikit-learn
・データベース:リレーショナルDB(PostgreSQL, MySQL)、NoSQL(MongoDBなど)、ベクトルDB(Elasticsearchなど)、グラフDB (Neptune, neo4j)
・生成AI関連:OpenAI API、GPT、BERT系モデル、RAGのためのカスタム実装もしくは既存ライブラリの活用
・クラウドプラットフォーム:AWS、Azureなどのクラウドサービス
・バージョン管理:Git、CI/CDツール
・API連携:RESTful API/GraphQL、Swaggerなどを利用したAPIドキュメント、セキュリティ(OAuth 2.0、JWT、APIキーなど)や認証処理
■働き方特徴(出張頻度や勤務形態など)
基本的にフレックス制度、在宅勤務制度を活用しています。(フルリモートではない)案件次第では、国内、海外を問わず出張が発生します。担当業務により頻度は異なります。
■この仕事の面白さ・魅力
・AIや機械学習は急速に進化している分野であり、常に新しい技術や手法が登場します。AIデータインテグレーションエンジニアとして、最新のトレンドを追い続け、自らの知識を深めることができる環境です。
・多様なバックグラウンドを持つエンジニアやデータサイエンティストとのコラボレーションが日常的です。お互いの知識や経験から学び合うことで、自身も成長できる環境があります。
●求める要件[MUST]
・Python、SQLを用いたデータ処理スクリプト、パイプラインの開発経験
・非構造化データ(テキスト、画像、音声など)の処理手法の理解と実装経験
・セマンティック検索、類似度検索等に対する基本的な知識
・ベクトルデータベースとグラフデータベースを含む多様なデータストアに関する理解
・RAGシステムや生成AI(大規模言語モデル)の基礎知識
●求める要件[WANT]
#RAG技術への知見
・RAGシステムの精度向上のために必要な技術理解(Pre-Retrieval, Post-Retrieval, Query Expansion, Chunking Strategy)
#クラウド・インフラ経験
・AWS、Azureなどのクラウドサービス上でのデータパイプライン構築経験
・Docker、Kubernetes等によるコンテナ化、オーケストレーション経験
#プロジェクト管理・アジャイル開発
・ScrumやKanbanなどのアジャイル手法を用いたプロジェクト進行経験
・DevOpsの実践やCI/CDパイプライン構築経験
#分析技術
・NLP、画像に対するAI/機械学習を用いた分析経験
8:30~17:00または9:00~17:30(部門による)
※所定内労働時間7時間45分(休憩45分)
部門によりフレックスタイム制あり。コアタイム10:00~15:15または10:30~15:45
・年間休日123日(うるう年は124日)
・週休2日制(基本は土・日・祝、当社カレンダーにより若干異なります)
・夏期休暇、お盆、年末年始、GW、有給休暇、半日有給休暇、慶弔休暇、産休・育児休暇、特別休暇、自己啓発支援特別休暇、自己実現特別休暇
昇給年1回(4月)、賞与年2回(6月、12月)
雇用保険、労災保険、健康保険、厚生年金保険
【東証プライム上場 財閥系 総合重機メーカー】 AI・データサイエンティスト(機械学習、深層学習、大規模言語モデル)
【AIを活用したデータ解析や情報管理のソリューション企業】 AI事業本部 ライフサイエンス分野でのAI研究
【東証プライム上場 有名総合輸送用機器メーカー】 生産技術本部 生産技術部プロセス先鋭グループ AI/自働化の研究開発担当
人々の生活や命を支えるため、「食料・水・環境」分野で地域に根ざした事業にチャレンジする
人の営みと地球環境が調和できる社会。 車載電池は一つの有効な手段になる。
本質を見極める洞察力を磨き、専門技術を深く学び続ける人材たちが、世界のプロジェクトを完遂に導いています。
創業120年超、蓄積された技術資産を活用し、 多様な領域でトップクラスのシェアを確立。 グローバル事業の拡大も加速させています。
子どもたちに愛され続け、進化するおもちゃたちが、日本から世界へ、新しい夢と感動を広げています。
「夢に見るほど電池が好き」 な社員たちが、化学・電気・機械のノウハウを結集し、次世代エネルギーデバイスの開発に挑む。