* You are viewing Posts Tagged ‘google’

Google Chrome acaip hızlı!

Google’ın web tarayıcısı Google Chrome‘dan “az önce” bahsettim; açıkçası hızından ve temiz arabiriminden başka çok fazla konuşulmaya değer bir özelliği de yok. Öyleki, RSS desteği bile olmaması komik duruyor. Sanırım Google Labs, herkesin Google’a kayıt olup RSS beslemelerini oradan okuduğunu sanmakta.

Gelgelelim, hız konusunda “bu kadar hızlı olamaz” dediğimde yanılmışım. Bazı benchmarklara ulaştım ve Google Chrome’un Javascript performansı “oha” dedirten cinsten.

Bu arada, lisans anlaşmasını okursanız, “Google’ın isterse ekstra reklam gösterebileceği” tarzında bir ifade dikkatinizi çekecektir. Birkaç sene önce, yeni “şeytanın” Microsoft değil, Google olacağını söylemiştim. Elinde her imkan var. Umarım yanılırım demiyorum,çünkü yanılmayacağım. Bu kadar gücün insanı baştan çıkarmaması olası değil.


Google Chrome acaip hızlı!

Google Chrome

google chromeBir süredir özgür yazılımla kanka olduğu izlenimi veren Google Labs, bu sefer Chrome ile nabız yokluyor.

Chrome, Firefox’dan KHTML’e kadar (Apple Safari) birçok “iz barındıran”, Google’ın yeni web tarayıcısı. Açıldığında, Opera ile Internet Explorer 7 karışımı bir browser ile karşılaşıyorsunuz. Açıkçası, hızını ve web sayfalarını doğru render etme özelliğini oldukça kayda değer buldum. Sayfanın görüntülendiği alanın oldukça büyük olması da artılarından biri; zira çoğu kullanıcı gibi bende F11 tuşunu kullanmayı sevmiyorum.

Bunun yanında, “öğeyi denetle” isimli çok hoş bir sağ tuş menüsü var. Bu araç, Mozilla Firefox’da vazgeçemediğim Firebug eklentisini andırıyor. Andırıyor diyorum; zira Firebug ile kıyaslandığında son derece primitif duruyor. Buna rağmen, yine de faydalı bir araç ve ilk çıkan sürümde olması gelecek vadedebileceğinin işaretlerini veriyor.

Sekmeli tarama özelliği elbette mevcut ve Opera’da yıllardır olduğu gibi, açılış sayfasına sık ziyaret ettiğiniz siteleri atabiliyorsunuz.

Oldukça etkileyici render hızı dışında, tarayıcının yüklenme hızı da gerçekten iyi. İlk dikkatimi çeken özelliklerden biri de, mouse’un scroll tuşunu kullandığımızda, sayfanın hızlı ve akıcı bir şekilde kayması oldu. Özellikle bloglar gibi, tuvalet kağıdı uzunluğunda sayfalar için küçük ama kullanımı kolaylaştıran, zekice bir detay.

Genel çalışma mantığı olarak, fena halde Firefox’u andırıyor; özellikle de sağ tuş menüleri.

Yine de, Google Chrome projesinden, bir nedenden ötürü hoşlanmadım: Firefox, kendi istatistiklerime göre, Türkiye genelinde bile %25 sınırını zorlarken, Google Chrome, Firefox’un hızını kesebilir. Bana göre Google’ın Mozilla Foundation’a maddi destek sağlaması, her ikisi açısından da daha olumlu bir adım olurdu.

İlk bakışta eklenti desteği yok gibi görünüyor; ancak Mozilla kodları zaten açık olduğundan, şayet isterlerse bu desteği de sağlamak zor değil. Bana daha çok, eski Intenet Explorer kullanıcılarını “caydırmak” için ortaya çıkmış, kullanımı basit ve temiz bir tarayıcı oluşturma çabası gibi geldi Chrome; belki bu yüzden, ileride çok gelişmiş özelliklere sahip olmasını beklemek yanlış olur.

Blogmani – Google ve Alexa verilerini çekmek

Daha önce, Technorati verilerini, Technorati API’si kullanarak çektiğimi söylemiştim.

Aynı şeyi, Alexa için yapamadım-miktar ne olursa olsun, Alexa API’lerini kullanmak için para ödemek zorundasınız.

Bu durumda, geriye iki seçenek kalıyordu: PHP’nin CURL fonksiyonları, ya da sayfaya soket açıp, sayfa içeriğini işlemek.

CURL kullanmanızı tavsiye etmem: aslında harika çalışıyor; ancak makinaya minimal bir Apache kurduktan sonra, CURL fonksiyonlarının çalışmadığını farkettim. Standart Apache kurulumu ile gelmeyen çoğu kütüphaneyi kullanmak risklidir - sunucunuzda da o fonksiyonlar olamayabileceğinden, bilgisayarınızdaki web sunucusunda güzel güzel çalışan projeniz, hostunuz üzerinde patlayabilir.

O zaman, ben de soket açarım dedim ve fsockopen’ı bol bol kullandım!

fsockopen ile açtığınız sayfalardan spesifik bir bilgiyi alabilmek için, Regular Expressions’ın kucağına düşüyorsunuz. Eğer çok iyi düzeyde Reg Ex bilginiz yoksa -benim gibi!- ve problemi hızlı çözmek zorundaysanız, bildiğiniz kadar Reg Ex ile, sprintf (ve türevleri) ile birlikte, PHP’nin katar işleme fonksiyonlarını kombine kullanın. 15 sene önce olsa farklı konuşurdum; artık yazılım geliştirmek kolay ama zaman çok kısıtlı. Günümüzde en kıymetli kodcu, hızlı olan. Bilgisayarlarda çok hızlı olduğundan, genelde yazabileceğiniz en kötü kod bile, aletlere ter attıramıyor. (Simulatör, 3D oyun, ya da genetik alanında kullanılan tarzda karmaşık programlar yazmadığınızı varsayıyorum!)

Alexa sorununu nispeten kolay çözdüm; zira verilerin düzenli bir XML formatında geldiği bir sayfaya çengel atmayı başarabildim!

Google API’leri günde 1000 sorguya izin verdiği ve sonuçları hala parse etmeniz gerektiği için, yine API kullanmama kararı aldım.

Google ile işim, kolay görünmesine rağmen, biraz maceralı geçti. Pagerank’i alan kodu Internet’ten 10 dakika içinde çalıp(!) neredeyse aynen kullandım. Gelgelelim, arama sonuçlarını veren bir kod bulamadım. Bulduğum üç örneğin ikisi CURL’e dayandığı için, daha ilk anda çalışmadılar. Üçüncü, soket kullanan örnek ise, yazılan yanlış Reg Ex ifadeleri yüzünden çalışmıyordu.

Kolları sıvayarak 2-3 saat içinde, link sayısını veren Google kodunu yazdım. Aslında, uzamanın nedeni, yine bir Reg Ex-PHP azizliğiydi…

Benim kullandığım Apache+PHP sunucusunda, Unicode’dan (UTF-8), ISO tabanlı dil kodlamalarına çeviri yapan fonksiyonlar çalışmıyor. (Açıkcası, hala geliştirilme aşamasında ve PHP’yi ICU desteği ile derlemeniz gerek). Sorun şu; sayfadan Türkçe karakterler geliyor ve Reg Ex, Unicode anlıyor olması gerektiği halde, anlamıyor ve unicode karakterleri bulamıyor. Çözüm? Unicode harfler yerine, Reg Ex’in (.) -nokta- güzelliğini kullanmak! Böylece, katarınız içindeki unicode karakterlerini “her ne gelirse” diye geçiştiriyorsunuz. Harika bir çözüm değil ama her koşulda işe yarıyor. En azından, insanlar php.net’te ve forumlarda “reg ex ile unicode işleyemiyoruz” diye ağlaşırken, siz geminizi yürütüyorsunuz.

Sonuç olarak, Google Pagerank, link sayısı ve Alexa verileri gibi bilgileri de çekmeyi başardım. Technorati işini de dün çözdüğüm için, geriye birkaç iş kaldı.

Bunlardan biri, çektiğim verileri veritabanına yazmak. Bu, en kolay iş.

İkincisi, bu sitelere ulaşılamadığında, scriptimin neler yapacağına karar verecek ek fonksiyonları yazmak. Örneğin, Technorati’den veri gelmezse, tekrar deneme yapılacak mı? Kaç kere denenecek?

Bu tip detaylar…

Üçüncüsü, bu modülü ne zaman ve nasıl çalıştıracağıma karar vermek. Bunun içinde sunucu üzerinde bazı denemeler yapmak gerekiyor. Örneğin, bana üzerinde cron çalıştırmak için izin veriyor mu? Şayet cron iznim yoksa, scripti manuel çalıştırmak gerek.

Son olarak, iş puanlama algoritmasını çıkarmaya kalıyor. Bu iş aslında son derece basit. Tek bir zorluğu var; o da adil ama rekabetçi bir algoritma çıkarmak.

Umuyorum, bir ve iki numaralı maddeleri Pazar ve Pazartesi günü hallederim.

Yeni Google Pagerank algoritması Orion ne getirecek?

Açıkçası Lyn‘de duydum Orion adını; elbette orada duymadım ilk kez, şimdi Firaxis’in sahibi olan Sid Meier’in Master Of Orion’ınını az oynamadım; Orion kültünü filan da bilirim. Ama Google’ın yeni bir algoritma kullanacağını bilmeme rağmen, Orion’dan haberim yoktu.

Neden mi yoktu haberim? Çünkü Google’ın ne yaptığıyla pek ilgilenmiyorum. Kafama göre, olabildiğince iyi, çok ve hızlı yazmaya çalışıyorum. Yalakalık yapayım, ondan bundan link alayım, acaba topliste filan mi girsem, kayıt olsam hangisi iyidir gibi kaygılarım yok. İnsanlar blogumu Google’dan bulsunlar, ama hakediyorsam. Zaten işim başımdan aşkın, bir de link dilenciliği yapsam yazmaya vaktim olmaz, zaten benim karakterime uyan bir hareket de değil.

Lakin “neymiş ki Orion” dedim; mevcut düzeni pek beğenmediğim için, acaba daha iyi birşey mi geliyor diye merak ettim.

Efendim; hitnews’daki yazının özeti şudur: Ori Allon diye, 26 yaşında Ph D yapmakta olan bir genç var. Gencimiz, üniversitede (Avustralya’da bilmemne üniversitesi, south new wales filan gibi, Avustralya’ya zamanında İngiltere’de ne kadar suçlu ve zevzek sürmüşler ya, onun için mekan adları hep İngiltere’den) ilim irfan yaparken (yok,Yahudi, Adnan Oktar’la işi olmaz) “ben bir arama motoru (araba motoru değil) algoritması geliştirivereyim diyor, hocalarıda (Fethullah Gülen hocaefendi değil, proflar filan) pek beğeniyor, kafasını okşuyor, “Aferin Oli, biz şimdi bunu Yahoo, Google, Microsoft’a filan çakarız” diyorlar.

Lakin Google yemi hemen yutmuyor. Sonunda imana geliyorlar, Oli Allon’a “gel bize takıl, bok gibi para veririz, algoritmanın adını da Orion koyarız” diyorlar. Oli, Ph D’yi yarım bırakarak, elinde tahta bavulu, Google’ın yolunu tutuyor. Ama üniversite de payını alıyor bu işten, çünkü onlarda döner sermaye yok, enayiler kantin açıp döner satmayı, otopark işletmeyi beceremedikleri için bütün gün hafızlayıp duruyorlar. Çünkü orada YÖK yok. (Belki Vietnamda filan vardır).

Bu arada, zamanında Orion’u duyan Bill Gates’de, Allon’un sırtını sıvazlayıp “aferin evladım” demiş; ancak para mara vermemiş. (Gates, Allon’dan daha Yahudi çıkmış!)

Oli, “ben bu işi 18 ayda gömerim abi” demiş; hadi bakalım.

Algoritma konusunda muhtelif spekülasyonlar var.

Gelgelelim, bizim basının sadece Türkiye’de yaşamadığını da öğrenmiş oldum (şimdi anlıyorum Reha Muhtar’ın “her nerede yaşıyor ve yaşatılıyorsan” lafını). Sydney Morning Herald da şöyle bir paragraf var:

Orion finds pages where the content is about a topic strongly related to the key word. It then returns a section of the page, and lists other topics related to the key word so the user can pick the most relevant.

The results of the query are displayed immediately in the form of expanded text extracts, giving the searcher the relevant information without having to go to the website - although there is still that option.

Anlayan varsa bana da anlatsın.

Lakin herkes kendi fikrini de “sıkmış” arada…

Ori’nin doktora teziyle ilgili bir sayfa buldum.

“Take a search such as the American Revolution as an example of how the system works. Orion© would bring up results with extracts containing this phrase. But it would also give results for American History, George Washington, American Revolutionary War, Declaration of Independence, Boston Tea Party and more. You obtain much more valuable information from every search.”

Yani diyor ki -mealen- Amerikan Devrimini araştırınca bize Amerikan tarihi,George Washington vs vs ile ilgili sonuçları da getirecekmiş.

Eğer bunu yapacaksa yandık. Şu durumda bile, aradığımızla ilgili sayısız alakasız sonuç alırken, bir de yeni algoritmayla olacak şeyleri düşünün.

Örneğin; Paris’i arıyorum. Paris Hilton sanacak, gerizekalılık, porno, vibratörle ilgili sonuçları filan da getirecek. Tabii o sayfada bunlar da varsa, ama emin olun ki vardır. Olmasa bile, zamanla webmaster’lar, “oldurmak” konusunda uzmanlaşacaklar…

Mesela Paris’teki Hilton otelini arıyorum, İngilizcem bozuk, Çinliyim ya, yazıyorum “Hilton in Paris”, oo gelen sonuçları düşünmeyin. Muhtemelen 112 sayfa sonuç çıkacak, ilk sırada soyadı Hilton olan, Paris Hilton’la düşük kalkmış herifler listesi.

Yani durum bana biraz yaş geldi.

Ama artık link alıp vermenin önemi olmayacakmış. Nasıl yani? 10.000 link alan siteyle, dün açılan site aynı mı olacak? Hiç sanmam. Ha, Internet yalakalarını yıldıracaksa ona da varım, ayrı konu. Hırsızları da çarpacakmış; mesela sen şimdi bu yazıyı benim siteden çalıp kendininkine monte ediverdin, Google senin siteni göstermeyecek,ya da diplerde gösterecek, en başta benimkini gösterecek..miş.

Nasıl olacak, mesela % kaçını çalmak hırsızlık sayılacak? Ya da şöyle düşünelim; Google’ın basın açıklamasından yukarıdaki satırları aldım, sonra Oli’nin üniversitesi aslında kendi hazırladığı tanıtıcı yazıyı bir süre sonra yayınlamaya karar verdi; ama bu arada yazıdan bir parçayı ben daha önce yayınlamış oldum. Bu durumda, benim sitem daha önce çıkacak arama sonuçlarında. İyi de, zaten mevcut durum da bu!

Özet olarak ben şunu anladım: “Biz aynen devam ediyoruz, sadece ek olarak ilgililik parametresini biraz geliştirdik”

Yeni birşey midir bu? Hayır. Bakınız PHP’nin similar_text fonksiyonu; buna çok benzer bir iş yapar. Azıcık geliştirirsiniz, Orion’da olur, Sirius da olur.

Google ile konuşan insanımız

İnsanlar genelde bilgisayarları zeka sahibi sanıyorlar. Dikkat edin, amatörlere yönelik bilgisayar kitapları, bu işin az buçuk okumuşları, şu cümleyi muhakkak bir yerde patlatır:”Aslında bilgisayarlar aptaldır, düşünemezler!”

Bu cümle, bir mail atmayı yarım günde zar zor becerebilen -ya da beceremeyen- insanoğlunun, karşısında çaresiz kaldığı bu makinaya, en sonunda muzaffer geleceğini ifade eden bir “umut” cümlesidir. Gelgelelim, bu pratikte asla olmaz. Bilgisayar kullanmayı yarım yamalak becerebilen insanlar, bilgisayara karşı korkuyla karışık bir kin, nefretle karışık bir saygı besler.

Internet ile birlikte, çoğumuz Google’ın aşırı zeki olduğunu sanmaya filan başladık herhalde. Aylardır yazılan arama kriterlerini ilgiyle takip ediyorum. Kelime öbeklerini biraz analiz edince, muhtemel iki durumla karşılaşıyoruz:

a. İnsanlar çok yalnızlar, Google’ı sohbet edebilecekleri bir arkadaş olarak görüyorlar.
b. İnsanlar, Google’ın çok zeki olduğunu ve konuşma dilinden anladığını düşünüyorlar.

a maddesi, sosyolog ve psikologların uzmanlık alanına giriyor.

b maddesi ise ilgimi çekiyor. Birazdan alıntı yapacağım arama kriterleri, bu gece yazılmışlar.

—————————————————–
Webin efendisi: “Yeni çıkan Peugeot 308 satış fiyatı”

Google: “Harbimi, ne zaman çıkmış abi?”
—————————————————–
Webin efendisi:”Sevgiliyi getirme büyüsü”

Google: “Orgazm anlamında mı, geri getirme babında mı sordun?”

Webin efendisi: “İkisini de söyle. Aslında ikincisini arıyordum, birinci konuda da sıkıntılarım var…”
—————————————————————
Webin efendisi: “Fort Mastank”

Google: “Ford diye bir araba markası, bir de fortçuluk diye bir vakıa buldum. Hankısı?”
——————————
Webin efendisi: “Nokıa 6550 kaç para?”

Google: “Ne bileyim lan kaç para, istersen yan banttaki reklamlara bir tıkla, orda çok ucuza satanlar var”
————————————–
Webin efendisi: “Etox Zafer nasıl bir araba kaç beygir”

Google: “Nefes al, teker teker sor”

1, toplam 1 sayfa1