【業務概要】
全国の医療機関、地方公共団体、介護事業者等から収集する医療データの内容を確認し、不正確・無関係なデータを特定し、医療データに対して正確な意味を見出す業務と、医療データに混入している個人情報に類するデータをマスキングする業務をAI等の最新技術や医療知識を使ってご担当いただきます。
【業務イメージ】
同社は、全国の医療機関や地方公共団体から医療データを収集いたします。
医療データは、仕様が統一されていないことが多く、また、医療機関によって入力・管理方法が異なることから、そのままでは利活用することができません。
すなわち、医療データの内容を確認し、不正確・無関係なデータを特定し、医療データに対して正確な意味を付与していくこと(標準化・クレンジング)が必要です。
また、医療データに混入している個人情報に類する情報を抽出・秘匿すること(マスキング)も必要となります。
今回募集する方には、こうした標準化・クレンジングやマスキングといった医療データの加工をAI等の技術や医療知識を使って実施する業務をご担当いただきます。
【具体的な業務内容】
【作業環境】
・言語:Python (Pandas, Transformersなど)、SQL、R、Shell、バッチ
・OS:Windows、Linux
・DB:Hadoop(Impala)、Amazon Redshift、Maria DB、PostgreSQL、DuckDB
・IDE:Visual Studio Code、Jupyterなど
・ソースコード管理:Git
・課題管理:Backlog
【仕事の魅力】
「医療ビッグデータ」をどう活用するのかという課題は、まだまだ未成熟な部分が多く、新たなサービスを作れるチャンスがあります。
自分の得意分野や興味がある分野にチャレンジしやすい環境です。
ビッグデータを高速に処理する技術を実践的に活用できます。
AI(大規模言語モデル)の学習から精度検証、実践運用までを体験することができます
数年後には、500万のデータ収集を目標にしており、レセプトデータの他、希少性の高い電子カルテデータも取り扱うことができます
【必須要件】
・何かしらのデータの観察・解析の実務経験もしくはデータマネジメント実務経験
・DB(SQL)を使用したデータ抽出業務等の実務経験
【歓迎要件】
・薬剤師、看護師、臨床検査技師で医療データを実業務で活用した経験
大規模医療データの取り扱い経験データベースシステムの実務利用経験
・NLP技術等を用いてテキストデータから目的の情報を抽出した経験
・Linuxコマンド群を用いてテキスト処理やファイル操作をした経験
・何らかのプログラミング言語でスクリプトを作成した経験
・作業プロセスや業務フローを分析し、効率化した経験
・医療系知識を学んだ経験
【歓迎資格】
・医療情報技師
・薬剤師
・看護師
・臨床検査技師
・データベース系資格
【求める人物像】
・成長意欲が高く、スタートアップ企業を自ら成長させたいという気概をお持ちの方
・チームワークを尊重し、積極的にコミュニケーションの取れる方
・職業倫理を遵守できる方
高度な専門性を持ち、お客様の業務に精通したSEと営業が一丸となり、 お客様のビジネスの成長を “攻めと守り”のITで支援。
世界に向かうデジタルビジネスのパートナーとして、売上拡大とコスト最適化を支援しています。
エネルギー、インフラ、ストレージ。3つの注力事業において、新しい人材が 「新生東芝」 を動かし始めています。
グローバル展開する企業のプライムパートナーとして、経営から製造現場まで、多様な課題の解決をITで支援。
マーケティング・コミュニケーションは、これまでの経験と勘に頼るスタイルから、データに基づいてPDCAを回すスタイルに変わり始めました。
「自分がどのくらいチャレンジできるだろうか」という軸で、新たな活躍の場をお探しの方に。