15 535 235

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

liked a model about 9 hours ago

MiniMaxAI/MiniMax-VL-01

liked a model about 10 hours ago

MiniMaxAI/MiniMax-Text-01

upvoted a paper about 10 hours ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

View all activity

Organizations

taufiqdp's activity

liked a model about 9 hours ago

MiniMaxAI/MiniMax-VL-01

Text Generation • Updated about 5 hours ago • 40 • 129

liked a model about 10 hours ago

MiniMaxAI/MiniMax-Text-01

Text Generation • Updated about 5 hours ago • 132 • 235

upvoted 2 papers about 10 hours ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published about 19 hours ago • 173

Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published 4 days ago • 45

liked a model 4 days ago

NovaSky-AI/Sky-T1-32B-Preview

Text Generation • Updated 2 days ago • 2.88k • 362

upvoted 2 papers 5 days ago

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published 6 days ago • 74

An Empirical Study of Autoregressive Pre-training from Videos

Paper • 2501.05453 • Published 6 days ago • 34

upvoted 3 papers 6 days ago

LLM4SR: A Survey on Large Language Models for Scientific Research

Paper • 2501.04306 • Published 7 days ago • 33

Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published 7 days ago • 78

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published 7 days ago • 218

liked a model 7 days ago

microsoft/phi-4

Text Generation • Updated 7 days ago • 72.3k • 1.3k

liked a Space 7 days ago

Running

152

🔥

Attention Visualization

Vision Transformer Attention Visualization

upvoted 2 papers 7 days ago

Cosmos World Foundation Model Platform for Physical AI

Paper • 2501.03575 • Published 8 days ago • 61

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Paper • 2501.03262 • Published 11 days ago • 78

upvoted a collection 8 days ago

Cosmos

Collection

The collection of Cosmos models • 31 items • Updated 4 days ago • 225

upvoted a paper 11 days ago

2 OLMo 2 Furious

Paper • 2501.00656 • Published 15 days ago • 15

upvoted a paper 12 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 14 days ago • 93

upvoted 2 papers 15 days ago

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published 21 days ago • 89

1.58-bit FLUX

Paper • 2412.18653 • Published 22 days ago • 72

liked a model 19 days ago

deepseek-ai/DeepSeek-V3

Updated 16 days ago • 132k • 1.87k