Arama Motorları Nasıl Çalışır?

  • Brian Curtis
  • 0
  • 2523
  • 288
reklâm

Joel Lee tarafından 10/10/2017 tarihinde güncellenen makale

Birçokları için Google olduğu internet. Yeni siteler bulmak için başlangıç ​​noktasıdır ve tartışmasız internetin kendisinden bu yana en önemli buluştur. Arama motorları olmadan, yeni web içeriği kitlelere erişilemez.

Ama arama motorlarının nasıl çalıştığını biliyor musunuz?? Her arama motorunun üç ana işlevi vardır: tarama (içeriği keşfetmek için), indeksleme (içeriği izlemek ve depolamak için) ve alma (kullanıcılar arama motorunu sorgularken ilgili içeriği almak için).

Emekleme

Tarama, her şeyin başladığı yerdir: bir web sitesi hakkında veri toplama.

Bu, sitelerin taranmasını ve her sayfa hakkında ayrıntıların toplanmasını içerir: başlıklar, resimler, anahtar kelimeler, diğer bağlantılı sayfalar, vb. Farklı tarayıcılar, sayfa yerleşimleri, reklamların yerleştirildiği yerler (bağlantılar tıkılıp tıklatılmış vb.) Gibi farklı ayrıntıları da arayabilir..

Ancak bir web sitesi nasıl taranır?? Otomatik bir bot “örümcek”) bir sonraki sayfaya gidilecek yeri bulmak için sayfa bağlantılarını kullanarak mümkün olduğunca çabuk sayfadan sonra sayfayı ziyaret eder. En erken günlerde bile, Google örümcekleri saniyede birkaç yüz sayfa okuyabilirdi. Bugünlerde, binlerce.

Bir web tarayıcısı bir sayfayı ziyaret ettiğinde, sayfadaki her bağlantıyı toplar ve ziyaret edilecek sonraki sayfalar listesine ekler. Listesindeki bir sonraki sayfaya gider, bağlantılarını toplar. o sayfa ve tekrarlar. Web tarayıcıları, değişiklik olup olmadığını görmek için arada bir geçmiş sayfaları tekrar ziyaret eder.

Bu, dizine alınmış bir siteden bağlanan herhangi bir sitenin sonunda taranacağı anlamına gelir. Bazı siteler daha sık taranır ve bazıları daha derinlere taranır, ancak bazen bir sitenin sayfa hiyerarşisi çok karmaşıksa bir tarayıcı vazgeçebilir.

Bir web tarayıcısının nasıl çalıştığını anlamanın bir yolu da kendiniz oluşturmaktır. PHP'de basit bir web tarayıcısı oluşturma hakkında bir eğitim yazdık, bu nedenle herhangi bir programlama deneyiminiz olup olmadığını kontrol edin..

Sayfaların olarak işaretlenebileceğini unutmayın “noindex,” bu da arama motorlarından endekslemesini atlamasını istemek gibi bir şey. İnternetin endekslenmemiş kısımları “derin internet” Derin Ağ Nedir? Düşündüğünden Daha Önemlidir Derin Ağ Nedir? Düşündüğünüzden Daha Önemlidir Derin ve koyu renkli ağlar hem korkutucu hem de çılgınca gelse de, tehlikeler aşıldı. İşte onların gerçekte ne olduğu ve kendinize nasıl erişebileceğiniz! ve TOR ağında barındırılanlar gibi bazı siteler arama motorları tarafından dizine eklenemez. (TOR ve soğan rotalaması nedir? Soğan Yönlendirmesi Nedir, Tam Olarak mı? Kime sorduğunuza bağlı olarak en kötü özellikleri).) Ortaya çıkan sorunların türünü bir kenara bırakmak…)

indeksleme

Dizin oluşturma, bir taramadaki verilerin işlenmesi ve veritabanına yerleştirilmesidir..

Sahip olduğunuz tüm kitapların, yayıncıların, yazarların, türlerinin, sayfa sayımlarının, vs. bir listesini yaptığınızı hayal edin. Tarama, dizin oluşturma sırasında her kitabı tararken, listenizde oturum açtığınızda.

Şimdi sadece kitaplarla dolu bir oda olmadığını, dünyadaki her kütüphaneyi hayal edin. Bu, Google’ın yaptığı ve bu verilerin tümünü binlerce petabayt değerinde sürücü içeren geniş veri merkezlerinde depolayan küçük boyutlu bir sürüm. Bellek Boyutları Bağlam İçinde 500GB'nin 100GB'tan fazla olduğunu görmek kolaydır. Fakat farklı boyutlar nasıl karşılaştırılır? Bir terabayt için gigabayt nedir? Bir petabayt nereye sığar? Hadi temizleyelim.! .

İşte Google’ın arama veri merkezlerinden birinin içine bir bakış:

Resim Kredisi: Google

Alma ve Sıralama

Arama motoru, arama sorgunuzu işlediğinde ve sorgunuzla eşleşen en alakalı sayfaları döndürdüğünde.

Çoğu arama motoru, arama yöntemleri sayesinde kendilerini farklılaştırır: seçmek ve bulmak istediğiniz sayfalara en uygun olanı seçmek için farklı ölçütler kullanırlar. Bu yüzden arama sonuçları Google ile Bing arasında değişkenlik gösteriyor ve Wolfram Alpha'nın neden bu kadar benzersiz olduğunu düşünüyorum: İngilizce Dilini Okuyup Yazdığınızda 10 Cool Wolfram Alpha Kullanımı Kafamı Wolfram Alpha'nın etrafına dolamak için biraz zaman ve bu sonuçları ortaya çıkarmak için kullandığı sorgular. Gerçekten yararlanmak için Wolfram Alpha'ya dalmak zorundasın. .

Sıralama algoritmaları, arama sorgunuzu aleyhinize kontrol eder milyarlarca Her birinin alaka düzeyini belirlemek için sayfaların listesi. Şirketler, sıralama algoritmalarını karmaşıklıklarından dolayı patentli endüstri sırları olarak koruyorlar. Daha iyi bir algoritma daha iyi bir arama deneyimine dönüşür.

Ayrıca web içerik oluşturucularının sistemi oynamasını ve haksız yere arama sonuçlarının üstüne çıkmasını istemiyorlar. Bir arama motorunun iç metodolojisi hiç tükenmemişse, her türlü insan kesinlikle bu bilgiyi sizin ve benim gibi arama yapanların zararına karşı kullanacaktır..

Image Credit: Shutterstock ile fotovibes

Arama motoru kullanımı olduğu tabii ki mümkün, ama artık o kadar kolay değil.

Orijinal olarak, arama motorları siteleri anahtar kelimelerin bir sayfada görünme sıklığına göre sıraladı. “anahtar kelime doldurma” - anahtar kelime-ağır saçmalık ile sayfaları doldurma.

Ardından bağlantı önemi kavramı geldi: arama motorları, siteye popülerliği bir ilişki olarak yorumladıkları için birçok gelen bağlantıya sahip sitelere değer verdi. Ancak bu, web’deki spam göndermeye neden oldu. Günümüzde, arama motorları ağırlık bağlantıları bağlı olarak “yetki” bağlantı sitenin. Arama motorları, bir devlet kurumundan gelen linklere link dizindeki linklerden daha fazla değer katmaktadır..

Bugün, sıralama algoritmaları her zamankinden daha fazla gizemli gizleniyor, ve “Arama motoru optimizasyonu” Demystify SEO: 5 Başlatan Yardım Arama Motoru Optimizasyonu Kılavuzları Demystify SEO: 5 Başlatan Yardım Arama Motoru Optimizasyonu Kılavuzları Arama motoru ustalık bilgi, deneyim ve deneme ve yanılma çok alır. Temel bilgileri öğrenmeye başlayabilir ve Web’de bulunan birçok SEO kılavuzunun yardımı ile kolayca ortak SEO hatalarından kaçınabilirsiniz. çok önemli değil İyi arama motoru sıralamaları artık yüksek kaliteli içerikten ve mükemmel kullanıcı deneyimlerinden geliyor.

Arama Motorlarında Sırada Ne Var??

Ah, şimdi ilginç bir soru var. Cevap “semantik”: anlam Sayfanın içeriğinden Anlamsal işaretlemeye ve gelecekteki etkisine genel bakışımızda Semantik İşaretlemenin Ne Olduğu ve İnterneti Her Zaman Nasıl Değiştireceği [Teknoloji Açıklamalı] Semantik İşaretlemenin Nedir ve İnterneti Her Zaman Nasıl Değiştireceği [Teknoloji Açıklaması] .

Ama işte bunun özü.

Şu an için arama yapabilirsiniz “glutensiz çerezler” ancak sonuçlar glutensiz çerezler için tarifler verebilir. Bunun yerine, diyen düzenli çerez tarifleri bulabilirsiniz. “Bu tarif glutensiz değildir.” Doğru anahtar kelimeleri var, ancak yanlış anlamı var.

Anlamsal olarak, çerez tariflerini arayabilir ve daha sonra bazı malzemeleri çıkarabilirsiniz: un, fındık vb. Sonuçları yalnızca 30 dakikadan daha az hazırlık süresi olan tarifelerle daraltabilir ve 4/5 veya daha yüksek puanları gözden geçirebilirsiniz.. o iyi olurdu, değil mi? Oraya gidiyoruz!

Hala arama motorlarının nasıl çalıştığı hakkında karıştı? Google'ın süreci nasıl açıkladığını görün:

Bunu ilginç bulduysanız, nasıl yapılacağını da öğrenmek isteyebilirsiniz. görüntü arama motorları çalışması.

Resim Kredisi: prykhodov / Depositphotos




Henüz no comments

Modern teknoloji hakkında basit ve uygun fiyatlı.
Modern teknoloji dünyasında rehberiniz. Her gün bizi çevreleyen teknolojileri ve araçları nasıl kullanacağınızı ve Internet'te ilginç şeyleri nasıl keşfedeceğinizi öğrenin.