ასოთა რიგითობა მათი გავრცელების მიხედვით

იმის დასადგენად რამდენად ხშირად გვხვდება ესა თუ ის ასო თანამედროვე ტექსტებში გამოყენებულია ვიკიპედიის სტატიების არქივი. ქართული ვიკიპედია უკვე 130 000 სტატიას გასცდა, რაც სავსებით საკმარისია ტექსტის სიხშირული ანალიზისთვის. ცხრილში ასახულია ასოების სიხშირული განაწილება 2020 აპრილის მდგომარეობით.

  1. 13.759%
  2. 12.585%
  3. 8.987%
  4. 7.205%
  5. 6.036%
  6. 5.335%
  7. 4.929%
  8. 4.823%
  9. 4.272%
  10. 4.131%
  11. 3.467%
  12. 2.942%
  13. 2.693%
  14. 2.367%
  15. 2.027%
  16. 1.875%
  17. 1.714%
  18. 1.605%
  19. 1.342%
  20. 1.168%
  21. 1.004%
  22. 0.917%
  23. 0.862%
  24. 0.823%
  25. 0.821%
  26. 0.558%
  27. 0.459%
  28. 0.382%
  29. 0.33%
  30. 0.238%
  31. 0.148%
  32. 0.124%
  33. 0.072%

პირველი ასოები

პირველი ასოების განაწილება საგრძნობად განსხვავდება ზოგადი სურათისგან.

  1. 13.019%
  2. 9.626%
  3. 9.173%
  4. 8.442%
  5. 5.98%
  6. 4.876%
  7. 4.56%
  8. 4.212%
  9. 4.185%
  10. 4.048%
  11. 3.362%
  12. 2.876%
  13. 2.478%
  14. 2.129%
  15. 1.958%
  16. 1.873%
  17. 1.873%
  18. 1.766%
  19. 1.585%
  20. 1.568%
  21. 1.548%
  22. 1.159%
  23. 1.13%
  24. 1.121%
  25. 1.039%
  26. 0.941%
  27. 0.762%
  28. 0.708%
  29. 0.707%
  30. 0.689%
  31. 0.278%
  32. 0.167%
  33. 0.162%

ბოლო ასოები

თავისებურია ყველაზე ხშირი ბოლოკიდური ასოების განაწილებაც.

  1. 25.37%
  2. 24.004%
  3. 20.356%
  4. 5.084%
  5. 4.185%
  6. 4.037%
  7. 3.688%
  8. 2.941%
  9. 2.239%
  10. 2.121%
  11. 1.704%
  12. 1.532%
  13. 0.666%
  14. 0.436%
  15. 0.32%
  16. 0.209%

წყვილების სიხშირული განაწილება

მომიჯნავე ასოების ყველაზე ხშირი კომბინაციები. ორ-ორი ასო.

  1. ის 3.431%
  2. ებ 2.367%
  3. ლი 2.132%
  4. და 2.129%
  5. ან 1.682%
  6. არ 1.646%
  7. სა 1.62%
  8. რი 1.523%
  9. ბი 1.341%
  10. ელ 1.254%
  11. მა 1.185%
  12. ერ 1.155%
  13. ამ 1.119%
  14. ნი 1.081%
  15. ია 1.025%
  16. ლე 0.963%
  17. ად 0.959%
  18. რე 0.955%
  19. გა 0.95%
  20. რო 0.921%
  21. ნა 0.91%
  22. ბა 0.903%
  23. ულ 0.893%
  24. მო 0.892%
  25. რა 0.886%
  26. მი 0.884%
  27. ში 0.884%
  28. ალ 0.846%
  29. ვე 0.835%
  30. ას 0.828%
  31. ენ 0.779%
  32. ავ 0.779%

სამეულების სიხშირული განაწილება

მომიჯნავე ასოების ყველაზე ხშირი კომბინაციები. სამ-სამი ასო.

  1. ები 1.152%
  2. ბის 0.685%
  3. ული 0.607%
  4. ლებ 0.581%
  5. ლის 0.567%
  6. ება 0.532%
  7. ელი 0.527%
  8. რის 0.418%
  9. რებ 0.394%
  10. ანი 0.376%
  11. ილი 0.351%
  12. ნის 0.346%
  13. რომ 0.342%
  14. ველ 0.342%
  15. ნებ 0.334%
  16. ური 0.334%
  17. არი 0.334%
  18. მის 0.325%
  19. იან 0.323%
  20. ალი 0.304%
  21. სახ 0.304%
  22. ერი 0.302%
  23. ვის 0.302%
  24. დებ 0.3%
  25. ობი 0.298%
  26. არე 0.295%
  27. ობა 0.284%
  28. ადა 0.283%
  29. აში 0.282%
  30. ამო 0.28%
  31. ერთ 0.279%
  32. მდე 0.276%

მონაცემები

მონაცემები მისაწვდომია JSON ფორმოტში. სიხშირული განაწილება გამოყენებულია კლავიატურის განლაგებათა შეფასების და ოპტიმიზაციის პროცესში.

21 ივლისი 2020. გიორგი ჭავჭანიძე.