ai-multimodal

16 results for tag "ai-multimodal"

🎯

Skills

ai-multimodalmrgoonie/claudekit-skills3350

Processes and generates multimedia content using Google Gemini API, including audio transcription, image analysis, video processing, and document extraction across multiple formats.

ai-multimodal

ai-multimodalbmad-labs/skills680

Processes and generates multimedia content using Google Gemini API, including audio analysis, image understanding, video processing, and document extraction with enhanced vision capabilities.

ai-multimodal

ai-multimodalsamhvw8/dot-claude350

A skill for multimodal AI processing via Google Gemini API with 2M token context, supporting audio transcription, image captioning/OCR/object detection, video analysis, PDF extraction, and image generation.

ai-multimodal

ai-multimodaljackspace/claudeskillz★ 26 ai-multimodalthe1studio/theone-training-skills★ 13 ai-multimodalbinhmuc/autobot-review★ 11 ai-multimodalmicrock/ordinary-claude-skills★ 9 ai-multimodalmamba-mental/agent-skill-manager★ 7 ai-multimodalduonglx/chanmayfoods

🎯

Skills

ai-multimodalmrgoonie/claudekit-skills3350

Processes and generates multimedia content using Google Gemini API, including audio transcription, image analysis, video processing, and document extraction across multiple formats.

ai-multimodal

ai-multimodalbmad-labs/skills680

Processes and generates multimedia content using Google Gemini API, including audio analysis, image understanding, video processing, and document extraction with enhanced vision capabilities.

ai-multimodal

ai-multimodalsamhvw8/dot-claude350

ai-multimodal