INFORMATION

【勉強会】New Business AI(新規事業-AI)実施 (2021年08月度)】

TOPICS2021.09.01

8月27日(金)は、月に一度のNew Business AI(新規事業-AI)を実施しました。
この勉強会は、弊社TOPWELLの文化となっており、社員同士の交流や知識向上を目的に行っております。
上期より新たなメンバーによりTeamsを用いたトレーニングコースとなりました。
今後着手が見込まれるAIを用いた新事業おいて必要となるPython、数学、機械学習の基礎知識を
本コースを通して学び、活用いただけることを期待しております。

今回の勉強会は具体的には
・パラメータチューニング等
– モデル評価方法
– ハイパーパラメータチューニング
– 不均衡データへの対応
・教師なし学習
・最終課題説明
でした。

まず最初に、機械学習の学習性能を左右するハイパーパラメータのチューニング方法を学習しました。
ハイパーパラメータの探索方法として「グリッドサーチ」「ランダムサーチ」の2つを紹介し
うち「グリッドサーチ」についてソースコードを見ながら学習しました。

また正例データと負例データの数に偏りがある不均衡データへの対応策とモデル評価時の注意点についても学習しました。
対応方法として、負例データを減らす「アンダーサンプリング」と正例データを増やす「オーバーサンプリング」の2つを紹介しました。
また、アルゴリズムとして両者に共通して使える「ランダムサンプリング」とオーバーサンプリングの「SMOTE」の2種類を紹介しました。
アルゴリズム説明の際、ソースコードを通して不均衡データへの対応は必ずしも必須ではなく
データの不均衡状態を解消した結果かえって学習性能が悪くなることもある点について説明しました。

次に教師なし学習のアルゴリズムとして「k-Means」「DBSCAN」を紹介し、実装方法をソースコードを見ながら学習しました。
また「k-Means」については、最適なクラスター数の決定に用いられる手法としてエルボー法を紹介しました。
教師なし学習の説明過程で、使用すべきアルゴリズムはデータに依存して決まるため事前にデータの確認が必要な点にも言及しました。

最後に、最終課題について説明を実施しました。

今後もメンバーのスキル向上や新製品・新サービスの開発に向け、より一層精進して参ります!