同社が運営する全サービスのデータを全社横断的に管理・運用し、データ活用を推進するためのデータ基盤構築・運用を担っていただきます。
〈具体的な業務内容〉
・Google Cloud上でのデータ活用基盤開発、保守運用
・ワークフローエンジンを用いたETL処理の開発、保守運用
・Pythonを用いた業務自動化ツールの開発
・データ蓄積観点からのデータベース設計およびテーブル設計のレビュー
・データドリブン経営を実現するためのデータマネジメント体制構築
・Terraformを用いたデータ基盤インフラのIaC化およびインフラ管理
・自社サイトのアクセスログデータ(ビュー、クリック、スクロール)
・顧客の属性データ、顧客の時系列情報
・自社社員の行動(架電履歴など)データ
・WEB広告(主にgoogle系)の配信成果データ等
・テキストデータ(QAサイトのデータ、求人票のデータ、経歴データなど)
・音声データ(通話)
・Google Cloud(BigQuery、GCS、CloudRunFunctions、CloudRun、CloudComposer、Dataform、Dataplex)
・AWS(EC2、ECS、Lambda、S3、RDS、Sagemaker)
・ワークフローエンジン(Airflow)
・Python
・SQL
・Git
・Terraform
・Fivetran
・データ基盤自体はBigQueryを中心としたGoogle Cloudで構築していますが、データソースとなる社内システムは全てAWSで構築されているため、Google Cloud/AWS両方の知識や経験を身に付けることができます。
・事業部長やマーケティング責任者といった意思決定層や、セールス、マーケターなど他職種ともコミュニケーションを取りながら業務を進める機会が多く、エンジニアの立場から事業をドライブさせていくことができます。
・データアナリスト、データサイエンティスト、機械学習エンジニアと一緒にプロジェクトを推進することも多く、BIツールの活用やデータマネジメント、機械学習プロダクト開発といったデータエンジニアリング周辺知識を身につける機会も多いため、データ活用に関する広い専門性を身につけると同時にキャリアを柔軟に構築することができます。
・RDBに格納された顧客データやアクセスログ以外にも、事業企画やマーケティングで使用するSaaSデータ、テキストデータや音声データといった非構造化データを扱うことができ、新規事業立ち上げと事業成長により、扱うデータの種類やデータ量は年々増加しています。
・技術選定やアーキテクチャ設計から担当することも多く、上流工程の経験を積む機会も少なくありません。
・私服可
・作業中イヤホン可
・ハーマンミラーの椅子
・メンター制度による中途入社者へのフォロー
・システム開発経験(言語不問)
・AWSやGoogle Cloudといったパブリッククラウドの基礎的な知識(業務経験は不問)
・大学卒
・Pythonを使用したアプリケーション/ツール開発の経験
・AWSやGoogle Cloudといったパブリッククラウドを用いた業務経験
・機械学習の基本的な知識
・成長企業で事業を推進する基盤作りの実績を積みたい方
・技術選定やアーキテクチャ設計といった上流工程の経験を積みたい方
・自学自習はもちろん、新しい技術のキャッチアップを怠らない方
・目的に向かった主体的に動ける方
・セールスやマーケターといった非技術職とのコミュニケーションを円滑に行える方
【東証プライム上場 財閥系 総合重機メーカー】 AI・データサイエンティスト(機械学習、深層学習、大規模言語モデル)
【AIを活用したデータ解析や情報管理のソリューション企業】 AI事業本部 ライフサイエンス分野でのAI研究
【東証プライム上場 有名総合輸送用機器メーカー】 生産技術本部 生産技術部プロセス先鋭グループ AI/自働化の研究開発担当
「LINE」ならではのビッグデータ分析から、これまでにないスコアリングモデルを開発。ユーザー志向の金融サービスを形にします。
世界に向かうデジタルビジネスのパートナーとして、売上拡大とコスト最適化を支援しています。
周りの人に喜んでもらえると、幸せ。原点の想いを事業とともに最大化していく。
医師が安心して意見交換できる会員制サイト『MedPeer』。臨床の「集合知」が新しい価値を生み、ビジネス拡大中です。
緻密な市場リサーチとプロモーション戦略に基づいて、質の高いコンテンツを内製し、より多くのユーザー様に届けたい。
「スマデバファースト」 をキーワードに現場から“10倍挑戦”するヤフーが動き出す。