نماذج اللغة الكبيرة للحمض النووي (بالإنجليزية: DNA large language models، وتُختصر: DNA-LLMs) هي فئة متخصصة من نماذج اللغة الكبيرة تُطوَّع لتحليل تسلسلات الدنا وتفسيرها. وتقوم فكرتها على التعامل مع القواعد الأربع للدنا (A وT وC وG) في إطار نصي بشري يمكن للنموذج أن يتعلّم أنماطها وسياقاتها، على نحو يشبه ما تفعله نماذج اللغة في النصوص البشرية.
وتنبع أهمية هذه النماذج من أن الجينوم يضم أيضًا عناصر تنظيمية وغير مُرمِّزة معقدة، مثل المعززات، ومواقع الارتباط التنظيمي، والبنى البنيوية طويلة المدى. وقد أتاحت مقاربة الدنا باللغات تعلّم تمثيلات عامة من بيانات جينومية ضخمة عبر التعلّم الذاتي الإشراف، ثم نقل هذه التمثيلات إلى مهام تحليلية متعددة، مثل التنبؤ بالعناصر الوظيفية، وتقدير أثر المتغيرات الجينية، والمقارنة بين الجينومات، وتصميم التسلسلات الحيوية اصطناعيًا.