IRCForumları - IRC ve mIRC Kullanıcılarının Buluşma Noktası - Tekil Mesaj gösterimi

Heartbroken · 25 Ocak 2012, 16:49

selam @[Üye Olmadan Linkleri Göremezsiniz. Üye Olmak için TIKLAYIN...]

kusura kalma gece uyumamıştım uyuyakalmışım şimdi görebildim..

Bu sorun ne yazık ki tüm tcl coderlarının başına bela bir konu ..size sadece bu konunun çözümü hakkında birkaç öneri-fikir nacizane verebilirim ilki speechless'in hemen tüm kodlarında kullandığı aslında perplexa'nın dictionary.tcl'sinden işin özünü aşırdığı şu kod parçası:

Kod: Kodu kopyalamak için üzerine çift tıklayın!

   # code below is neccessary to prevent numerous html markups
   # from appearing in the output (ie, &quot;, ᘧ, etc)
   # stolen (borrowed is a better term) from perplexa's urban
   # dictionary script..
   if {![string match *&* $text]} {return $text}
   if {[string match "*;*" $char]} {set char [string trim $char {;}] }
   set escapes {
  &nbsp; \xa0 &iexcl; \xa1 &cent; \xa2 &pound; \xa3 &curren; \xa4
  &yen; \xa5 &brvbar; \xa6 &sect; \xa7 &uml; \xa8 &copy; \xa9
  &ordf; \xaa &laquo; \xab &not; \xac  \xad &reg; \xae
  &macr; \xaf &deg; \xb0 &plusmn; \xb1 &sup2; \xb2 &sup3; \xb3
  &acute; \xb4 &micro; \xb5 &para; \xb6 &middot; \xb7 &cedil; \xb8
  &sup1; \xb9 &ordm; \xba &raquo; \xbb &frac14; \xbc &frac12; \xbd
  &frac34; \xbe &iquest; \xbf &Agrave; \xc0 &Aacute; \xc1 &Acirc; \xc2
  &Atilde; \xc3 &Auml; \xc4 &Aring; \xc5 &AElig; \xc6 &Ccedil; \xc7
  &Egrave; \xc8 &Eacute; \xc9 &Ecirc; \xca &Euml; \xcb &Igrave; \xcc
  &Iacute; \xcd &Icirc; \xce &Iuml; \xcf &ETH; \xd0 &Ntilde; \xd1
  &Ograve; \xd2 &Oacute; \xd3 &Ocirc; \xd4 &Otilde; \xd5 &Ouml; \xd6
  &times; \xd7 &Oslash; \xd8 &Ugrave; \xd9 &Uacute; \xda &Ucirc; \xdb
  &Uuml; \xdc &Yacute; \xdd &THORN; \xde &szlig; \xdf &agrave; \xe0
  &aacute; \xe1 &acirc; \xe2 &atilde; \xe3 &auml; \xe4 &aring; \xe5
  &aelig; \xe6 &ccedil; \xe7 &egrave; \xe8 &eacute; \xe9 &ecirc; \xea
  &euml; \xeb &igrave; \xec &iacute; \xed &icirc; \xee &iuml; \xef
  &eth; \xf0 &ntilde; \xf1 &ograve; \xf2 &oacute; \xf3 &ocirc; \xf4
  &otilde; \xf5 &ouml; \xf6 &divide; \xf7 &oslash; \xf8 &ugrave; \xf9
  &uacute; \xfa &ucirc; \xfb &uuml; \xfc &yacute; \xfd &thorn; \xfe
  &yuml; \xff &fnof; \u192 &Alpha; \u391 &Beta; \u392 &Gamma; \u393 &Delta; \u394
  &Epsilon; \u395 &Zeta; \u396 &Eta; \u397 &Theta; \u398 &Iota; \u399
  &Kappa; \u39A &Lambda; \u39B &Mu; \u39C &Nu; \u39D &Xi; \u39E
  &Omicron; \u39F &Pi; \u3A0 &Rho; \u3A1 &Sigma; \u3A3 &Tau; \u3A4
  &Upsilon; \u3A5 &Phi; \u3A6 &Chi; \u3A7 &Psi; \u3A8 &Omega; \u3A9
  &alpha; \u3B1 &beta; \u3B2 &gamma; \u3B3 &delta; \u3B4 &epsilon; \u3B5
  &zeta; \u3B6 &eta; \u3B7 &theta; \u3B8 &iota; \u3B9 &kappa; \u3BA
  &lambda; \u3BB &mu; \u3BC &nu; \u3BD &xi; \u3BE &omicron; \u3BF
  &pi; \u3C0 &rho; \u3C1 &sigmaf; \u3C2 &sigma; \u3C3 &tau; \u3C4
  &upsilon; \u3C5 &phi; \u3C6 &chi; \u3C7 &psi; \u3C8 &omega; \u3C9
  &thetasym; \u3D1 &upsih; \u3D2 &piv; \u3D6 &bull; \u2022
  &hellip; \u2026 &prime; \u2032 &Prime; \u2033 &oline; \u203E
  &frasl; \u2044 &weierp; \u2118 &image; \u2111 &real; \u211C
  &trade; \u2122 &alefsym; \u2135 &larr; \u2190 &uarr; \u2191
  &rarr; \u2192 &darr; \u2193 &harr; \u2194 &crarr; \u21B5
  &lArr; \u21D0 &uArr; \u21D1 &rArr; \u21D2 &dArr; \u21D3 &hArr; \u21D4
  &forall; \u2200 &part; \u2202 &exist; \u2203 &empty; \u2205
  &nabla; \u2207 &isin; \u2208 &notin; \u2209 &ni; \u220B &prod; \u220F
  &sum; \u2211 &minus; \u2212 &lowast; \u2217 &radic; \u221A
  &prop; \u221D &infin; \u221E &ang; \u2220 &and; \u2227 &or; \u2228
  &cap; \u2229 &cup; \u222A &int; \u222B &there4; \u2234 &sim; \u223C
  &cong; \u2245 &asymp; \u2248 &ne; \u2260 &equiv; \u2261 &le; \u2264
  &ge; \u2265 &sub; \u2282 &sup; \u2283 &nsub; \u2284 &sube; \u2286
  &supe; \u2287 &oplus; \u2295 &otimes; \u2297 &perp; \u22A5
  &sdot; \u22C5 &lceil; \u2308 &rceil; \u2309 &lfloor; \u230A
  &rfloor; \u230B &lang; \u2329 &rang; \u232A &loz; \u25CA
  &spades; \u2660 &clubs; \u2663 &hearts; \u2665 &diams; \u2666
  &quot; \x22 &amp; \x26 &lt; \x3C &gt; \x3E O&Elig; \u152 &oelig; \u153
  &Scaron; \u160 &scaron; \u161 &Yuml; \u178 &circ; \u2C6
  &tilde; \u2DC &ensp; \u2002 &emsp; \u2003 &thinsp; \u2009
  &zwnj; \u200C &zwj; \u200D &lrm; \u200E &rlm; \u200F &ndash; \u2013
  &mdash; \u2014 &lsquo; \u2018 &rsquo; \u2019 &sbquo; \u201A
  &ldquo; \u201C &rdquo; \u201D &bdquo; \u201E &dagger; \u2020
  &Dagger; \u2021 &permil; \u2030 &lsaquo; \u2039 &rsaquo; \u203A
  &euro; \u20AC &apos; \u0027 &lrm; "" &rlm; "" ‬ "" - ""
  - ""
   };

bu utf-8 karakter çözücü parçanın en gelişmiş düzeyde nasıl kullandığına dair örnek [Üye Olmadan Linkleri Göremezsiniz. Üye Olmak için TIKLAYIN...] bu scriptini gösterebilirim.

bunun dışında Polonya'lı tomekk'in bir iki kodunda kullandığı daha basit ama tüm utf-8 karakterlerini çözümlemekten uzak bir denemesi :

Kod: Kodu kopyalamak için üzerine çift tıklayın!

 set arg [encoding convertto utf-8 $arg]
 
proc pxi2h:convert {text} { 
  global pxi2h 
  regsub -all {\]} $text {p!c1} text 
  regsub -all {\[} $text {p!c2} text 
  regsub -all {\}} $text {p!c3} text 
  regsub -all {\{} $text {p!c4} text 
  regsub -all {\$} $text {p!c5} text 
  regsub -all {\"} $text {p!c6} text 
  regsub -all {\;} $text {p!c7} text 
  regsub -all {\\} $text {p!c8} text 
  regsub -all {\/} $text {p!c9} text 
  regsub -all {\&} $text {\&amp;} text 
  regsub -all {\<} $text {\&lt;} text 
  regsub -all {\>} $text {\&gt;} text 
  regsub -all {\"} $text {\&quot;} text 
  regsub -all {  } $text {\&nbsp; } text 
  if {$pxi2h(mstrip) == 1} { 
    set text [pxi2h:clean $text] 
  } 
  return $text 
} 
proc pxi2h:unconvert {text} { 
  regsub -all {p!c1} $text "\]" text 
  regsub -all {p!c2} $text "\[" text 
  regsub -all {p!c3} $text "\}" text 
  regsub -all {p!c4} $text "\{" text 
  regsub -all {p!c5} $text "\$" text 
  regsub -all {p!c6} $text "\"" text 
  regsub -all {p!c7} $text "\;" text 
  regsub -all {p!c8} $text "\\" text 
  regsub -all {p!c9} $text "\/" text 
  return $text 
}

Rusların bu konuyla ilgili yoğun çabaları denemeleri var Barker.jr sergei username gibi rus coderlarının suzi patch yapımcılarının rusça böyle http.tcl ile birlikte kullanılan genellikle siteden veri alıp kanala yansıtan rusça kodları için yanlış hatırlamıyorsam 1334.tcl adını verdikleri utf-8 karakter çözümleyen bir çalışmaları var ve pek çok rusça scriptin çözümlenmesinde bunu kod içinde ek olarak kullanıyorlar bu iş için.

ve dikkatimi gene çeken merlin2.tcl içinde regsub kullanarak harflerin tek tek tanımlanması oldu..

Kod: Kodu kopyalamak için üzerine çift tıklayın!

 regsub -all {ğ} $tgcurrentanswer "g" tgcurrentanswer
 regsub -all {Ğ} $tgcurrentanswer "G" tgcurrentanswer
 regsub -all {ü} $tgcurrentanswer "u" tgcurrentanswer
 regsub -all {Ü} $tgcurrentanswer "U" tgcurrentanswer
 regsub -all {ş} $tgcurrentanswer "s" tgcurrentanswer
 regsub -all {Ş} $tgcurrentanswer "S" tgcurrentanswer
 regsub -all {ı} $tgcurrentanswer "i" tgcurrentanswer
 regsub -all {İ} $tgcurrentanswer "I" tgcurrentanswer
 regsub -all {ö} $tgcurrentanswer "o" tgcurrentanswer
 regsub -all {Ö} $tgcurrentanswer "O" tgcurrentanswer
 regsub -all {ç} $tgcurrentanswer "c" tgcurrentanswer
 regsub -all {Ç} $tgcurrentanswer "C" tgcurrentanswer

başka bir kod içinde her bozuk çözümlenmemiş şeklin karşılığının hangi harf olması gerektiğini tek tek göstermek için replace kullanımıda şimdi hatırlamadığım bir kod içinde gözüme çarpmışttı..

umarım bu örnekler size sorunun çözümü yolunda bir yardımı dokunur.

iyi çalışmalar