Meta(旧Facebook)によって開発された汎用セグメンテーションモデルであるSAM(Segment Anything Model)を試してみました。SAMは、特定のクラスに依存せず、任意のオブジェクトのセグメントが可能で、さらに「プロンプト(指示)」に基づいてその対象を指定することが可能で、具体的には、
- 点(例:画面中央の1点)
- ボックス(矩形領域)
- マスク(既知の一部マスク)
などがあるようです。
以下は、中心点に着目した例です。情報工学技術を利用した教育支援、いわゆる教育工学の研究やってます。研究に関係する技術動向(プログラミングねた)や、日常の覚書き、呟きなどを書いていこうかと思います。今のところ、初歩的なプログラムネタばっかりですが、、、、長い目でお付き合いください。
Meta(旧Facebook)によって開発された汎用セグメンテーションモデルであるSAM(Segment Anything Model)を試してみました。SAMは、特定のクラスに依存せず、任意のオブジェクトのセグメントが可能で、さらに「プロンプト(指示)」に基づいてその対象を指定することが可能で、具体的には、
などがあるようです。
以下は、中心点に着目した例です。表題の通り、IRT(Item Response Theory)のライブラリを動かしてみました。Rの例は多いんですが、Pythonはまだ少ない感じ。とりあえずChatGPTに聞きながらですけど、このコードになるまで試行錯誤しました。ChatGPTの言うことがただしければ、pipでインストールされるライブラリにはバグがあるようなので、ライブラリをラップする自作クラスで再定義したという応急的処理をしてます。ミスがあればコメントください。