PostgreSQLをAIに活用
by Canonical on 23 April 2024
AIを扱うことはデータを扱うこと。数値データから動画や画像まで、業界や用途を問わず、AIプロジェクトは何らかの形でデータに依存します。問題は、そのデータをどうやって効率的に保管し、モデルを構築する際に使用するかです。解決策の1つは、実績があり、愛好者の多いデータベースであるPostgreSQLです。近年の開発により、AIをサポートする有力な選択肢になっています。
PostgreSQLを選ぶべき理由
PostgreSQLはオープンソースで高機能のデータベースシステムです。外部キー、サブクエリ、トリガーのほか、さまざまなユーザー定義型や関数をサポートしています。近年はデータベース分野で人気を高め、2023年には年間最優秀データベース管理システム(DBMS)に選出されました。
PostgreSQLは、FinOpsやeコマースなど、あらゆる業界に採用されています。オンライントランザクション処理、分析、地理空間データなど、さまざまなワークロードにも適合します。ソリューションの幅広い採用は、数多くの具体的なユースケースのための新しい拡張機能やライブラリの開発につながっています。機械学習もその1つです。
PostgreSQLをAIに活用
PostgreSQLには1,000種類を超える拡張機能があります。それらの拡張機能は、Postgresコアシステム内の機能上に追加機能を提供するアドオンモジュールです。地理空間データの処理から、ベクトルデータベースへのPostgreSQLの変換まで、さまざまな拡張機能を利用できます。拡張機能は分析や検索などの幅広い機能に対応します。
これらの拡張機能の柔軟性と幅広い機能は、AIプロジェクトの強化に大きな可能性をもたらします。
AIに関連性の高い拡張機能として、以下のようなものがあります。
- Pgvectorは、PostgreSQL用のオープンソースのベクトル類似検索機能です。埋め込みの保存にも使用できます。この機能によって、OpenSearchと同様にデータベースをベクトルデータベースとして使用できます。
- Hydraは、オープンソースのカラム型データベースです。Hydraではコードを修正しなくても数十億行単位で効率的なクエリを即座に実行できます。この機能は、MLプロジェクトで大量のデータ処理が必要な場合に役立ちます。
- PostgresMLは、PostgreSQLの拡張機能で動作する、あらゆる機能を備えたMLOpsプラットフォームです。この機能によって、組織はデータベース内にモデルを構築できます。
MLOpsにおけるPostgreSQLの役割
MLOpsは機械学習向けのDevOpsです。KubeflowなどのMLOpsプラットフォームは、PostgreSQLをはじめとするさまざまなタイプのデータベースからデータを取り込みます。さらに、データベースを使用して、実験、ジョブ、パイプライン実行、単一スカラーメトリックにわたるメタデータなど、アーティファクトの一部を保管します。Kubeflowとデータベースは、信頼性が高い、シームレスに統合されたものである必要があります。これは、Kubeflowとデータベースの可用性が実運用環境でMLプロジェクトを実行する能力に影響を及ぼすためです。
PostgreSQLはKubeflowとの併用に最適したデータベースですが、すべてのシナリオで最良の選択であるとは限りません。実際には、MySQLなどの選択肢も有力です。使用するデータベースを選択する際は、組織にとって最適なソリューションを優先してください。
- 既存のデータベース – MLOpsプラットフォームでMySQLなどの特定のデータベースをすでに使用している場合は、PostgreSQLに変更することによって不要なオーバーヘッドが発生する可能性があります。
- スキルセット – チームのスキルや経験に合わせてデータベースを選択します。PostgreSQLの使用経験がある場合、このユースケースにはPostgreSQLを選択することが理想的です。
MySQLとPostgreSQLに関するその他の考慮事項については、こちらのホワイトペーパーをご覧ください。
Charmed PostgreSQLをAIに活用
Charmed PostgreSQL Operatorは、PostgreSQLデータベース管理システムで設計から運用までの自動化された運用管理を提供します。Charmed PostgreSQL OperatorはJuju上で動作する、オープンソースのエンドツーエンドの実運用環境に対応したデータプラットフォームです。PostgreSQLを物理マシン/仮想マシンとKubernetes上にデプロイして運用するために2つのフレーバーがあります。どちらも、レプリケーション、TLS、パスワードのローテーション、アプリケーションとの使いやすい統合などの機能を提供します。
Charmed PostgreSQL Operatorは、体系化された一貫性のある方法でPostgreSQLをデプロイするニーズに応えます。また、構成の柔軟性をユーザーに提供します。その結果、実運用環境でのPostgreSQLのデプロイ、スケーリング、構成、管理を信頼性の高い方法で大規模に簡素化できます。PostgreSQLはそれ自体がAIプロジェクトに適しています。Charmed OperatorはAIプロジェクトのレベルを引き上げ、データの保管とMLモデルの構築をさらに容易にします。
参考資料
ニュースレターのサインアップ
関連記事
Canonical、Ubuntu Pro for WSLを発表
Windows環境におけるUbuntu 24.04 LTSのWSLインスタンスにセキュリティメンテナンスとエンタープライズサポートを一括して提供。包括的なシステム管理機能も利用できるサブスクリプションサービス。 Canonicalは本日、Ubuntu Pro for WSLの一般提供を発表しました。Microsoftストアからインストール、ソースコードとベータ版はGitHubからダウンロード可能です。 「CanonicalとMicrosoftは、緊密なパートナーシップを通じてWSLの各種機能を構築しています。この取り組みは、WSLを利用して実運用向けのLinuxソリューションを構築する企業の開発者に有益です。」 Microsoft、WSLプロダクトマネージャー、Craig […]
バックポートでパッケージのサポート終了を回避
2025年7月、Gitは危険度の高い脆弱性「CVE-2025-48384」の報告を受けました。攻撃者がこの脆弱性を悪用すれば、リポジトリのクローンを作成する際に任意のコードを実行できます。米国のサイバーセキュリティ・インフラストラクチャセキュリティ庁(CISA)は、この脆弱性の実際の悪用事例を確認後、Known Exploited Vulnerabilities(KEV、悪用が確認されている脆弱性)のカタログに追加しました。 この脆弱性の公開時に標準サポート終了を過ぎていたユーザーにとって、選択肢は2つでした。Ubuntu Proのサブスクリプションでセキュリティパッチを入手するか、開発者の作業環境やCI/CDインフラに既知のリモートコード実行(RCE)脆弱性を抱えたまま […]
Canonical、FIPS対応のKubernetesを公開
FIPS 140-3暗号化とDISA-STIGハードニングを備えた、FedRAMP対応のKubernetesクラスターとアプリケーションスイートを導入しましょう。 本日、KubeConにおいて、Ubuntuを提供するCanonicalは同社のKubernetesディストリビューションでFIPSモードを有効化するためのサポートを公開しました。これにより、高いセキュリティの導入や連邦政府向けの導入に適したスケーラブルなクラスターの構築と管理に必要なすべての要素を提供します。バージョン1.34以降、Canonical Kubernetesは認証済みの暗号モジュールを使用した内蔵FIPS 140-3機能とともに使用できます。このFIPS機能を備えた導入により、snapパッケージと […]