オープンソースの力を解き放つ:IBM Watson Xがイノベーションを活用する方法

IBMワトソンXがオープンソースのイノベーションを活用してエンタープライズAIとデータを支えるしくみを発見してください。Codeflare、PyTorch、KServe、Prestoなどのオープンソースツールと技術を探索し、OpenShiftでモデルトレーニング、チューニング、データ分析をスケールさせる仕組みを理解してください。

2025年2月14日

party-gif

IBMのWatson Xプラットフォームが、オープンソースの力を活用して最先端のAIとデータソリューションを提供する方法を発見してください。効率的なモデルトレーニング、チューニング、推論、およびシームレスなデータ収集とアナリティクスを可能にするオープンソース技術を探ってください。このブログ記事では、Watson Xにおけるオープンソースがイノベーションを推進する方法の包括的な概要を提供します。これにより、企業はAIとデータの最良のものを活用できるようになります。

Watson Xにおけるオープンソースの利点

IBMは、オープンソースへの貢献と、その活用による製品への組み込みの歴史が長い。この伝統は、IBMの新しいエンタープライズAIおよびデータプラットフォームであるWatson Xにも継承されている。オープンソースを活用することで、Watson Xは最先端のAI、イノベーション、モデルを活用できる。

Watson Xにおけるオープンソースの活用は、3つの主要な側面にわたる:モデルの学習と検証、モデルのチューニングと推論、データの収集と分析。

モデルの学習と検証では、オープンソースプロジェクトのCodeflareを活用する。Codeflareは、Ray、Kubernetes、PyTorchと連携し、機械学習ワークロードのスケーリング、キューイング、デプロイメントのための使いやすい抽象化を提供する。

モデルの表現にはオープンソースの機械学習フレームワークPyTorchを使用する。PyTorchは、テンソルサポート、GPU高速化、分散学習など、重要な機能を提供し、大規模で複雑なモデルの効率的な処理を可能にする。

モデルのチューニングと推論では、オープンソースプロジェクトのKServeとModel Meshを活用する。これらの技術により、OpenShiftプラットフォーム上で数千ものAIモデルを効率的に提供できる。さらに、オープンソースプロジェクトのKKITは、プロンプトチューニングのAPIを提供し、推論機能を強化する。

最後に、データの収集と分析では、オープンソースのSQLクエリエンジンであるPrestoを活用する。Prestoの高パフォーマンス、スケーラビリティ、データ原本でのクエリ実行機能は、Watson Xのデータエコシステムにとって重要な要素となる。

オープンソースの活用により、Watson Xは最先端のAI、イノベーション、モデルを活用でき、ユーザーが大規模な知的アプリケーションを構築・展開できるようサポートする。

Codeflareを使ったモデルトレーニングと検証

モデルの学習と検証には大量のクラスタリソースを必要とし、特に数十億パラメータを持つ基盤モデルの場合はその傾向が強い。クラスタを効率的に活用し、データサイエンティストの作業を容易にするため、IBMはオープンソースプロジェクトのCodeflareを開発した。

Codeflareは、機械学習ワークロードのスケーリング、キューイング、デプロイメントのための使いやすい抽象化を提供する。Ray、Kuberay、PyTorchと連携してこれらの機能を実現する。Rayにより、ジョブの抽象化を提供し、KuberayによってRayをOpenShiftなどのKubernetesプラットフォーム上で実行できる。

Codeflareの一般的な使用例では、まずRayクラスタを立ち上げる。データサイエンティストは、このクラスタに学習ジョブを投入できる。OpenShiftクラスタが高負荷で利用可能リソースがない場合、Codeflareはジョブをキューイングし、リソースが利用可能になるまで待機する。場合によっては、ワークロードに合わせてクラスタをスケールアップすることもできる。学習と検証が完了すると、Codeflareはレイジョブを削除し、クラスタから削除する。

Codeflareの主な利点は、基盤となるインフラストラクチャを気にすることなく、データサイエンティストがクラスタ、あるいは複数のOpenShiftクラスタを効率的に活用できることである。

PyTorchによるモデルの表現

PyTorchは、モデルを表現するための重要な機能を提供する。これには、テンソルサポート、GPU高速化、分散学習などが含まれる。

テンソルは、モデルの予測精度を向上させるために時間をかけて調整される重み付き値や確率を格納する多次元配列である。PyTorchのテンソルサポートにより、これらの複雑なモデルパラメータを効率的に表現できる。

PyTorchのGPU高速化機能は、大規模で複雑なモデルの学習時の高速な計算を可能にする。さらに、PyTorchの分散学習機能により、単一マシンに収まりきらないモデルの学習を複数マシンで行うことができる。

PyTorchのその他の重要な機能には以下が含まれる:

  • ニューラルネットワークの作成: PyTorchでは、さまざまなタイプのニューラルネットワークを簡単に作成できる。
  • データロード: PyTorchは使いやすいデータロード機能を提供する。
  • 学習ループ: PyTorchには、モデルパラメータを効率的に更新し、予測精度を向上させる組み込みの学習ループがある。
  • モデル調整: PyTorchの自動勾配計算機能により、モデルパフォーマンス改善のための微調整が簡単になる。

これらのPyTorchが提供するオープンソースの機能を活用することで、Watson Xはエンタープライズ級のAIおよびデータプラットフォームの一部として、複雑なAIモデルを効率的に表現し、学習することができる。

オープンソース技術を使ったモデルのチューニングと推論

大量のAIモデルを効率的にスケールしてOpenShiftで提供したい。そのためのオープンソースプロジェクトとして、KServ Model MeshとKKitを活用している。

KServ Model Meshにより、単一のポッド内で数千ものモデルを効率的に提供できる。以前のKServは1ポッドあたり1モデルしか提供できず、非効率的だった。KServとModel Meshを統合することで、OpenShiftクラスタ上で大量のモデルを効率的に提供できるようになった。

これらのモデルを見つけるために、20万を超えるオープンソースモデルを持つHugging Faceリポジトリを活用している。IBMはHugging Faceと提携しており、Watson X製品にこれらのモデルを活用できる。

さらに、プロンプトチューニングのAPIを提供するオープンソースプロジェクトのKKitも使用している。これにより、推論時にモデルをファインチューニングし、結果を改善できる。

これらのオープンソース技術を組み合わせることで、OpenShiftでの大量のAIモデルの提供とチューニングを実現し、Watson Xの推論機能を支えている。

Prestoを使ったデータ収集とアナリティクス

Prestoは、Watson Xのデータ収集と分析に活用しているオープンソースプロジェクトである。Prestoは高性能なSQLクエリエンジンで、オープンデータ分析とオープンデータレイクハウスを支える。

Prestoの主な特徴は以下の通り:

  • 高パフォーマンス: Prestoは高スケーラブルで、高速なクエリ実行を提供し、大規模なデータ分析に適している。

  • フェデレートクエリ: Prestoにより、複数のデータソースにまたがるクエリが可能で、データの統一ビューを提供できる。

  • データ原本でのクエリ: Prestoは、データを移動せずにデータ原本でクエリできるため、集中リポジトリへの移動が不要。

Prestoを使うことで、Watson Xは様々なデータソースからデータを効率的に収集・分析し、AIおよび機械学習機能を支えることができる。

結論

IBMは長年にわたりオープンソースへの貢献と活用の歴史を持ち、Watson Xもその伝統を継承している。Watson Xは、IBMの新しいエンタープライズAIおよびデータプラットフォームで、最先端のAI、イノベーション、モデルを提供するためにオープンソースを活用している。

Watson Xで使用されているオープンソースプロジェクトは、モデルの学習と検証、モデルの表現、モデルのチューニングと推論、データの収集と分析など、AIおよびデータパイプラインのさまざまな側面にわたる。

モデルの学習と検証では、機械学習ワークロードのスケーリング、キューイング、デプロイメントのための使いやすい抽象化を提供するオープンソースプロジェクトのCodeflareを活用する。Ray、Kubeflow、PyTorchと連携して、クラスタリソースの効率的な活用を実現する。

モデルの表現には、テンソルサポート、GPU高速化、分散学習などの重要な機能を提供するオープンソースプロジェクトのPyTorchを使用する。

モデルのチューニングと推論では、OpenShiftクラスタ上で数千ものAIモデルを効率的に提供するオープンソースプロジェクトのKServ Model MeshとHugging Faceを活用する。さらに、プロンプトチューニングのAPIを提供するオープンソースプロジェクトのKKitも使用している。

最後に、データの収集と分析には、高性能なSQLクエリエンジンであるオープンソースプロジェクトのPrestoを活用している。

オープンソースの活用により、Watson XはこれまでのイBMのオープンイノベーションの伝統を継承し、お客様に最高のAIおよびデータソリューションを提供している。

FAQ