obito_od

KNIMEでGiskard拡張を使ってみる:導入編

さぁKNIME&データ分析勉強会 Advent Calendar 2024も終わりが見えてまいりました。
KNIMEをあまりご存知なかった方々の中にはこれまでの発表内容でちょっと興味出てきたかも、
使ってみようかな?という方もいらっしゃるかもしれません。

そのようなあなた!の背中をさらに後押しできるかは分かりませんが、これより3日間に渡っておびとより

KNIMEでGiskard拡張を使ってみる

をお届けしたいと思います。
不慣れでは御座いますが精一杯務めさせて頂きますのでどうぞよろしくお願い致します。

KNIME AP Ver5.3の新機能

KNIME APがVer5.3となって改善新規実装されたものは沢山あるのですがその中で著者おびとが
特にイイね!と思った内容を知人にテンション高く伝えてみました。

  1. 生成AIと連携強化されてHuggingFaceと連携が可能に!(すごい!!
  2. K-AIがデータ整形を手伝ってくれるExpression Node実装!(素敵!!
  3. Giskardと連携して構築したモデルを評価してくれる!(ふぅん?

みたいな感じなんです。ちょっと酷くない?

Giskardって何?

ということでGiskardとは?というところからお話をさせて頂きましょう。
参考:giskard.ai

Giskardは、AIモデルの品質管理と評価のためのオープンソースプラットフォームで、
AIモデルの性能、バイアス、セキュリティの問題を自動的に検出し、AIアプリケーションの品質と信頼性を
向上させるためのツールとなっております。
その対象としては大規模言語モデル(LLM)から機械学習モデル(ML)、果ては表形式モデルまでと幅広く、

[Pythonベースで]

さくっと実行させることができます。

今年5月にはGitHub AcceleratorというオープンソースAIプロジェクトの支援プログラムにて
その将来性が認められて見事支援金を獲得してたりします。今後の更なる発展が期待できますね。
参考:2024 GitHub Accelerator: Meet the 11 projects shaping open source AI

これを知った自分は むむ、なんかすごそうだぞ!使ってみたい!!と思ったりしたわけですが、[Pythonベース]という表現からも想像できる通り 利用するためにはpythonパッケージとして提供されているもの、例えばgiskard[llm]を使用することになります。 つまりは使いたかったらpythonコーディングして下さいねと。

もうね、こうなってしまうと自分のようなコーディング弱者からしたら
難易度が一気に跳ね上がるわけで、ドキュメントを参照してみても あっ(察し
とそっ閉じすることしかできませんでした。

これまでは。

KNIMEから救いの手

さすがは我らがKNIME、それではあまりに悲しかろう?と自分のようなコーディング弱者に救いの手を差し伸べて下さいました。

そう、先に挙げたKNIMEとGiskardの連携です。この記事を執筆している11/10時点においては
機械学習モデル(ML)に関する部分についてKNIME Giskard Extensionとして、
大規模言語モデル(LLM)に関する部分についてKNIME AI Extensionの一部として
それぞれ実装されています。

これ、どうして分けて実装されているんでしょうね。いくつか理由は想像できますがそのどれも涙を禁じ

閑話休題

さて、Giskard拡張はどちらもとっても強力で見どころ沢山なのですが、残念ながら使い方がパッと分かるような
ネット文献はなかなか見当たらず、ましてや日本語解説は無いに等しいために気軽に予習することもできず、、、
な状態となっています。

とりあえずExtensionをinstallしてみてなんとなく使おうとしてみてもまず数分でうん、分からんとなってしまいます。
(というかなりました。)

KNIMEは便利だぞおじさんを自称する身としてはこんな状況にと日々心を痛めて、、、たりはしないものの
同じ経験をする方は少ない方が良いよね、とは考えております。

と、いうわけでせっかくの機会ですから明日以降実戦編としてこんな感じで使うのか!
というのを一緒に勉強していきたいと思います。

なお、全部やるの面倒なので紙面の関係上今回はMLの分類問題を題材とさせて頂きますこと、予めご了承下さい。
もう数日駄文が続きますが辛抱強くお付き合いくださいませ。

実戦編に続く。。。