http://www.elshami.com

Zipf's law

قانون زيبف


قانون مشهور في القياسات الببليومترية  bibliometrics   يتعلق بتكرار الألفاظ في النصوص. وقد سمي هذا القانون بعد العالم اللغوي George Kingsley Zipf (1902-1950).

ويمكن بيان هذا القانون إذا أحصينا عدد تكرار كل كلمة في أحد النصوص، ثم رتبنا الكلمات حسب مراتبها بحيث أن الكلمات التي تتكرر كثيرا ترد في الترتيب أولا. والنصوص المكتوبة باللغة الإنكليزية تتضمن كلمات تتكرر كثيرا باستمرار، مثل: the, a  أو أي كلمات أخرى ذات معاني سطحية، وبهذا يمكننا التعبير عن قانون زيبف بقانونين.

القانون الأول:
يسمى القانون الأول بقانون زيبف للألفاظ عالية التردد. أما درجة علو التردد فتعتمد على النص محل التحليل.

والقانون الأول:   r * f = C

حيث:

r     تكون المرتبة الخاصة بالألفاظ التي تتكرر عدد  f من المرات.
C   هي المعلمة parameter  التي تعتمد على النص الجاري تحليله.

 ويذكر زيبف في:

Zipf, G. K. (1949). Human behavior and the principle of least effort. Cambridge, MA: Addison Wesley. 

أنه وجد علاقة ارتباطية واضحة بين عدد الكلمات المختلفة في كتاب Ulysses of James Joyce  وتكرار استعمال تلك الكلمات، بمعنى أنها تقارب المعادلة البسيطة للقطع الزائد القائم equilateral hyperbola.

 فمثلا، في تحليل زيبف لنص من Ulysses، وردت الكلمة التي في المرتبة العاشرة 2653 مرة، والكلمة التي في المرتبة العشرين 1311 مرة.

وناتج ضرب 10 * 2653 هو  26530
وناتج ضرب 20 * 1311 هو  26220

وتكون قيمة C   (حوالي 26000) ثابتة حتى الكلمة التي تقع في المرتبة الألف، التي ترددت 26 مرة. وناتج ضرب
1000 * 26 = 26000

القانون الثاني:

والقانون الثاني لزيبف يتعلق بالألفاظ ذات التردد المنخفض. ودرجة الانخفاض تعتمد على النص الجاري تحليله، ولكنها بالتأكيد ستشمل الألفاظ ذات الترددات 1، 2، 3، 4، 5.

وفي نفس العمل (صفحة 32) يذكر زيبف القانون كالآتي:

N(f2 - ¼) = C

 حيث:

N    هي عدد الألفاظ التي تكررت كل منها f  مرة
C    هي معلمة parameter  تعتمد على النص الجاري تحليله

وفي المقالة التالية،

Booth, A. D. (1967). A "law" of occurrences for words of low frequency. Information and Contnol, 10, 386-393.

ورد قانون زيبف في الصيغة التالية:

  In ÷  I1 = 3 / (4n2 - 1)

 

حيث:

In  هي عدد الألفاظ التي تكررت n  مرة
I1  هي عدد الألفاظ التي تكررت مرة واحدة

 See also: Booth's law; Bradford's law; Brookes' law; Estroup's law; Leimkuhler's law; Lotka's law; Pareto's law; Price's law; Rousseau's law; Willis' law