عند تطبيقها على تحليل النصوص textual analysis، تكون هي نسبة عدد الكلمات المختلفة (تسمى: الأنواع types) في نص إلى عدد الكلمات (تسمى العلامات tokens) في النص.
وقد استخدم Chen and Leimkuhler هذه الطريقة لانتاج الصيغة التالية والتي وجداها مساوية لواحد.
Vt/t + ln Vt/ln t
حيث:
Vt
هي
عدد الكلمات المختلفة
t
هي عدد الكلمات
ln
هي
اللوغاريتم الطبيعي
Chen,
Y-S.
and Leimkuhler, F. F. (1989).
A type-token identity in the Simon-Yule model of
text. Journal of the American Society for Information Science,
40, 45-53.