Konu: UHF 8 Sorunu
Tekil Mesaj gösterimi
Alt 25 Ocak 2012, 16:49   #4
Çevrimdışı
Heartbroken
Kullanıcıların profil bilgileri misafirlere kapatılmıştır.
IF Ticaret Sayısı: (0)
IF Ticaret Yüzdesi:(%)
Cevap: UHF 8 Sorunu




selam @[Üye Olmadan Linkleri Göremezsiniz. Üye Olmak için TIKLAYIN...]

kusura kalma gece uyumamıştım uyuyakalmışım şimdi görebildim..

Bu sorun ne yazık ki tüm tcl coderlarının başına bela bir konu ..size sadece bu konunun çözümü hakkında birkaç öneri-fikir nacizane verebilirim ilki speechless'in hemen tüm kodlarında kullandığı aslında perplexa'nın dictionary.tcl'sinden işin özünü aşırdığı şu kod parçası:

Kod:   Kodu kopyalamak için üzerine çift tıklayın!
# code below is neccessary to prevent numerous html markups # from appearing in the output (ie, ", ᘧ, etc) # stolen (borrowed is a better term) from perplexa's urban # dictionary script.. if {![string match *&* $text]} {return $text} if {[string match "*;*" $char]} {set char [string trim $char {;}] } set escapes {   \xa0 ¡ \xa1 ¢ \xa2 £ \xa3 ¤ \xa4 ¥ \xa5 ¦ \xa6 § \xa7 ¨ \xa8 © \xa9 ª \xaa « \xab ¬ \xac ­ \xad ® \xae ¯ \xaf ° \xb0 ± \xb1 ² \xb2 ³ \xb3 ´ \xb4 µ \xb5 ¶ \xb6 · \xb7 ¸ \xb8 ¹ \xb9 º \xba » \xbb ¼ \xbc ½ \xbd ¾ \xbe ¿ \xbf À \xc0 Á \xc1  \xc2 à \xc3 Ä \xc4 Å \xc5 Æ \xc6 Ç \xc7 È \xc8 É \xc9 Ê \xca Ë \xcb Ì \xcc Í \xcd Î \xce Ï \xcf Ð \xd0 Ñ \xd1 Ò \xd2 Ó \xd3 Ô \xd4 Õ \xd5 Ö \xd6 × \xd7 Ø \xd8 Ù \xd9 Ú \xda Û \xdb Ü \xdc Ý \xdd Þ \xde ß \xdf à \xe0 á \xe1 â \xe2 ã \xe3 ä \xe4 å \xe5 æ \xe6 ç \xe7 è \xe8 é \xe9 ê \xea ë \xeb ì \xec í \xed î \xee ï \xef ð \xf0 ñ \xf1 ò \xf2 ó \xf3 ô \xf4 õ \xf5 ö \xf6 ÷ \xf7 ø \xf8 ù \xf9 ú \xfa û \xfb ü \xfc ý \xfd þ \xfe ÿ \xff ƒ \u192 Α \u391 Β \u392 Γ \u393 Δ \u394 Ε \u395 Ζ \u396 Η \u397 Θ \u398 Ι \u399 Κ \u39A Λ \u39B Μ \u39C Ν \u39D Ξ \u39E Ο \u39F Π \u3A0 Ρ \u3A1 Σ \u3A3 Τ \u3A4 Υ \u3A5 Φ \u3A6 Χ \u3A7 Ψ \u3A8 Ω \u3A9 α \u3B1 β \u3B2 γ \u3B3 δ \u3B4 ε \u3B5 ζ \u3B6 η \u3B7 θ \u3B8 ι \u3B9 κ \u3BA λ \u3BB μ \u3BC ν \u3BD ξ \u3BE ο \u3BF π \u3C0 ρ \u3C1 ς \u3C2 σ \u3C3 τ \u3C4 υ \u3C5 φ \u3C6 χ \u3C7 ψ \u3C8 ω \u3C9 ϑ \u3D1 ϒ \u3D2 ϖ \u3D6 • \u2022 … \u2026 ′ \u2032 ″ \u2033 ‾ \u203E ⁄ \u2044 ℘ \u2118 ℑ \u2111 ℜ \u211C ™ \u2122 ℵ \u2135 ← \u2190 ↑ \u2191 → \u2192 ↓ \u2193 ↔ \u2194 ↵ \u21B5 ⇐ \u21D0 ⇑ \u21D1 ⇒ \u21D2 ⇓ \u21D3 ⇔ \u21D4 ∀ \u2200 ∂ \u2202 ∃ \u2203 ∅ \u2205 ∇ \u2207 ∈ \u2208 ∉ \u2209 ∋ \u220B ∏ \u220F ∑ \u2211 − \u2212 ∗ \u2217 √ \u221A ∝ \u221D ∞ \u221E ∠ \u2220 ∧ \u2227 ∨ \u2228 ∩ \u2229 ∪ \u222A ∫ \u222B ∴ \u2234 ∼ \u223C ≅ \u2245 ≈ \u2248 ≠ \u2260 ≡ \u2261 ≤ \u2264 ≥ \u2265 ⊂ \u2282 ⊃ \u2283 ⊄ \u2284 ⊆ \u2286 ⊇ \u2287 ⊕ \u2295 ⊗ \u2297 ⊥ \u22A5 ⋅ \u22C5 ⌈ \u2308 ⌉ \u2309 ⌊ \u230A ⌋ \u230B ⟨ \u2329 ⟩ \u232A ◊ \u25CA ♠ \u2660 ♣ \u2663 ♥ \u2665 ♦ \u2666 " \x22 & \x26 < \x3C > \x3E O&Elig; \u152 œ \u153 Š \u160 š \u161 Ÿ \u178 ˆ \u2C6 ˜ \u2DC   \u2002   \u2003   \u2009 ‌ \u200C ‍ \u200D ‎ \u200E ‏ \u200F – \u2013 — \u2014 ‘ \u2018 ’ \u2019 ‚ \u201A “ \u201C ” \u201D „ \u201E † \u2020 ‡ \u2021 ‰ \u2030 ‹ \u2039 › \u203A € \u20AC ' \u0027 ‎ "" ‏ "" ‬ "" - "" - "" };

bu utf-8 karakter çözücü parçanın en gelişmiş düzeyde nasıl kullandığına dair örnek [Üye Olmadan Linkleri Göremezsiniz. Üye Olmak için TIKLAYIN...] bu scriptini gösterebilirim.

bunun dışında Polonya'lı tomekk'in bir iki kodunda kullandığı daha basit ama tüm utf-8 karakterlerini çözümlemekten uzak bir denemesi :
Kod:   Kodu kopyalamak için üzerine çift tıklayın!
set arg [encoding convertto utf-8 $arg] proc pxi2h:convert {text} { global pxi2h regsub -all {\]} $text {p!c1} text regsub -all {\[} $text {p!c2} text regsub -all {\}} $text {p!c3} text regsub -all {\{} $text {p!c4} text regsub -all {\$} $text {p!c5} text regsub -all {\"} $text {p!c6} text regsub -all {\;} $text {p!c7} text regsub -all {\\} $text {p!c8} text regsub -all {\/} $text {p!c9} text regsub -all {\&} $text {\&amp;} text regsub -all {\<} $text {\&lt;} text regsub -all {\>} $text {\&gt;} text regsub -all {\"} $text {\&quot;} text regsub -all { } $text {\&nbsp; } text if {$pxi2h(mstrip) == 1} { set text [pxi2h:clean $text] } return $text } proc pxi2h:unconvert {text} { regsub -all {p!c1} $text "\]" text regsub -all {p!c2} $text "\[" text regsub -all {p!c3} $text "\}" text regsub -all {p!c4} $text "\{" text regsub -all {p!c5} $text "\$" text regsub -all {p!c6} $text "\"" text regsub -all {p!c7} $text "\;" text regsub -all {p!c8} $text "\\" text regsub -all {p!c9} $text "\/" text return $text }

Rusların bu konuyla ilgili yoğun çabaları denemeleri var Barker.jr sergei username gibi rus coderlarının suzi patch yapımcılarının rusça böyle http.tcl ile birlikte kullanılan genellikle siteden veri alıp kanala yansıtan rusça kodları için yanlış hatırlamıyorsam 1334.tcl adını verdikleri utf-8 karakter çözümleyen bir çalışmaları var ve pek çok rusça scriptin çözümlenmesinde bunu kod içinde ek olarak kullanıyorlar bu iş için.

ve dikkatimi gene çeken merlin2.tcl içinde regsub kullanarak harflerin tek tek tanımlanması oldu..

Kod:   Kodu kopyalamak için üzerine çift tıklayın!
regsub -all {ğ} $tgcurrentanswer "g" tgcurrentanswer regsub -all {Ğ} $tgcurrentanswer "G" tgcurrentanswer regsub -all {ü} $tgcurrentanswer "u" tgcurrentanswer regsub -all {Ü} $tgcurrentanswer "U" tgcurrentanswer regsub -all {ş} $tgcurrentanswer "s" tgcurrentanswer regsub -all {Ş} $tgcurrentanswer "S" tgcurrentanswer regsub -all {ı} $tgcurrentanswer "i" tgcurrentanswer regsub -all {İ} $tgcurrentanswer "I" tgcurrentanswer regsub -all {ö} $tgcurrentanswer "o" tgcurrentanswer regsub -all {Ö} $tgcurrentanswer "O" tgcurrentanswer regsub -all {ç} $tgcurrentanswer "c" tgcurrentanswer regsub -all {Ç} $tgcurrentanswer "C" tgcurrentanswer

başka bir kod içinde her bozuk çözümlenmemiş şeklin karşılığının hangi harf olması gerektiğini tek tek göstermek için replace kullanımıda şimdi hatırlamadığım bir kod içinde gözüme çarpmışttı..

umarım bu örnekler size sorunun çözümü yolunda bir yardımı dokunur.

iyi çalışmalar

__________________
Beş Tas Has Hoş Hoşaf.
 
Alıntı ile Cevapla

IRCForumlari.NET Reklamlar
sohbet odaları reklam ver Benimmekan Mobil Sohbet