EXAONE 4.5-33B:LG AI Research的终极多模态AI模型完全指南 EXAONE 4.5-33BLG AI Research的终极多模态AI模型完全指南【免费下载链接】EXAONE-4.5-33B项目地址: https://ai.gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.5-33BEXAONE 4.5-33B是LG AI Research开发的首个开源权重多模态AI模型通过在现有EXAONE 4.0框架中集成专用视觉编码器将模型能力扩展到多模态领域。该模型总参数达330亿其中视觉编码器占12亿参数在通用基准测试中表现出色尤其在文档理解和韩语语境推理方面超越了类似规模的SOTA模型。 模型核心特性解析 架构设计亮点EXAONE 4.5-33B采用因果语言模型与视觉编码器的创新组合其架构具有以下显著特点混合注意力机制采用16组3滑动窗口注意力1全局注意力的交替模式平衡长文本处理效率与全局理解能力reordered Norm技术在注意力/MLP之后、残差连接之前应用归一化提升训练稳定性视觉编码器优化采用分组查询注意力GQA和2D RoPE位置嵌入增强图像理解能力 关键性能参数参数数值语言模型参数317亿视觉编码器参数12.9亿隐藏层维度5,120上下文长度262,144 tokens词汇表大小153,600知识截止日期2024年12月 评估结果一览EXAONE 4.5-33B在多项基准测试中展现了卓越性能尤其在STEM领域和文档理解任务中表现突出MMMU78.7分接近GPT-5 mini的79.0分MathVision75.2分超过GPT-5 mini的71.9分AI2D文档理解89.0分与Qwen3-VL 235B相当K-Viscuit韩语任务80.1分优于同类模型⚡ 快速上手指南 模型获取git clone https://gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.5-33B 推荐部署方案EXAONE 4.5-33B支持多种优化推理引擎推荐以下部署方式TensorRT-LLM部署pip install githttps://github.com/nuxlear/transformers.gitadd-exaone4_5 trtllm-serve LGAI-EXAONE/EXAONE-4.5-33B \ --tp_size 2 \ --port 8000 \ --reasoning_parser qwen3vLLM部署uv pip install githttps://github.com/lkm2835/vllm.gitadd-exaone4_5 uv pip install githttps://github.com/nuxlear/transformers.gitadd-exaone4_5 vllm serve LGAI-EXAONE/EXAONE-4.5-33B \ --served-model-name EXAONE-4.5-33B \ --port 8000 \ --tensor-parallel-size 2 \ --max-model-len 262144 最佳配置参数根据任务类型选择合适的生成参数通用任务temperature1.0, top_p0.95, presence_penalty1.5OCR/文档任务temperature0.6, top_p0.95, top_k20文本任务temperature1.0, top_p0.95 使用场景示例 图文问答推理模式适用于需要精确结果的任务启用推理模式可提升复杂问题的解决能力from openai import OpenAI client OpenAI( base_urlhttp://localhost:8000/v1, api_keyEMPTY, ) messages [ { role: user, content: [ { type: image_url, image_url: {url: 本地图片路径}, }, { type: text, text: 分析图片内容并回答相关问题, }, ] } ] response client.chat.completions.create( modelEXAONE-4.5-33B, messagesmessages, max_tokens32768, temperature1.0, top_p0.95, presence_penalty1.5, extra_body{chat_template_kwargs: {enable_thinking: True}} ) print(response) 文本问答对于纯文本任务EXAONE 4.5-33B继承了前代模型强大的语言理解能力from openai import OpenAI client OpenAI( base_urlhttp://localhost:8000/v1, api_keyEMPTY, ) messages [{role: user, content: 解释EXAONE 4.5的核心优势}] response client.chat.completions.create( modelEXAONE-4.5-33B, messagesmessages, max_tokens32768, temperature1.0, top_p0.95 ) print(response)⚠️ 注意事项EXAONE 4.5默认启用推理模式enable_thinkingTrue如需更快响应可关闭推荐使用\boxed{}格式来获取更易于解析的答案模型需要至少单张H200 GPU或4张A100-40GB GPU才能高效运行详细使用指南请参考项目根目录下的README.md文件 许可证信息该模型采用EXAONE AI Model License Agreement 1.2 - NC许可证仅供非商业用途。使用前请仔细阅读许可条款确保符合使用规范。 相关资源技术报告arXiv:2604.08644配置文件config.json生成配置generation_config.json分词器配置tokenizer_config.json【免费下载链接】EXAONE-4.5-33B项目地址: https://ai.gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.5-33B创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考