HTML5
HTML Templates
Minimal Valid HTML5 Markup
<!doctype html>
<html lang="de-CH">
<head>
<meta charset="utf-8">
<title>Minimal Valid HTML5</title>
<meta name="viewport" content="width=device-width, initial-scale=1.0">
</head>
<body>
</body>
</html>
Meta Refresh - HTML Weiterleitung
<!doctype html>
<html lang="de">
<head>
<meta charset="utf-8">
<meta name="robots" content="noindex, follow">
<title>Meta Refresh</title>
<meta http-equiv="refresh" content="0; URL=https://danielbieli.tk">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
</head>
<body>
</body>
</html>
TXT Konfigurationsdatein
robots.txt
Der einfachste Aufbau der robots.txt sieht folgendermaßen aus:
User-agent: *
Disallow:
Dieser Code bewirkt, dass der Googlebot alle Seiten crawlen darf. Um dem Bot das Crawlen der kompletten Webpräsenz zu verbieten, solltest Du folgende Angabe in Deine robots.txt Datei schreiben:
User-agent: *
Disallow: /
Beispiel: Möchtest Du, dass Dein Verzeichnis /info/ nicht vom Googlebot gecrawled wird, dann gib folgenden Befehl in der robots.txt Datei an:
User-agent: Googlebot
Disallow: /info/
humans.txt
Die Datei robots.txt stellt "Robotern" (in Form von Software/Webcrawler) zusätzliche Informationen über eine Webseite zur Verfügung. In Anlehnung hieran hat Google 2011 die Datei humans.txt eingeführt, die menschlichen Besuchern der Webseite zusätzliche Hintergrundinformationen bieten soll.Diese Datei wird seitdem auch von anderen Webseiten verwendet, um z. B. die Programmierer der Webseite namentlich zu nennen oder die eingesetzte Software zu beschreiben. Google selbst nutzt die Datei für eine kurze Selbstdarstellung und Verweise auf Arbeitsplätze im Unternehmen.
Google is built by a large team of engineers, designers, researchers, robots, and others in many different sites across the globe. It is updated continuously, and built with more tools and technologies than we can shake a stick at. If you'd like to help us out, see google.com/careers.
<head></head>
Meta Tags
META NAME="ROBOTS"
<meta name="robots" content="noindex, follow">
<meta name="robots" content="index, nofollow">
<meta name="robots" content="noindex, nofollow">
Gültige Werte für das Attribut "CONTENT" sind: "INDEX", "NOINDEX", "FOLLOW", "NOFOLLOW". Wenn es kein robots -Tag gibt, ist der Standardwert "INDEX, FOLLOW".
Dies ist auch korrekt so, da alles "Indexieren & Folgen" eigentlich immer gewünscht ist. Es ist viel weniger Arbeit nur die Ausnahmen zu markieren. Zum Beispiel externe Links sollten so aussehen:
Externer Link (Öffnen im neun Tab & nofollow)
<a href="https://danielbieli.tk" target="_blank" rel="nofollow">Daniel Bieli</a>
<meta name="robots" content="noindex, follow">
Impressumseite (Soll Google nicht in Index aufnehmen, aber die Links auf der Seite trotzdem wete
<meta name="robots" content="index, nofollow">
Inhaltlich gute Seite mit nur externen Links. Wenn nofollow
im Head angegeben wird, wird per default keinem Link mehr gefolgt.
<meta name="robots" content="noindex, nofollow">
Eine Login Seite zum Beispiel. Weder soll diese indexiert werden noch soll der Robot unser Crawl Guthaben verschwenden mit nicht öffentlichen Links.
GEO Meta Tag
Geo-Tags sind HTML-Meta-Tags, die eine Aussage über die geografische Lokation einer Webseite oder der ganzen Site machen.
<meta name="geo.region" content="CH-SO" />
<meta name="geo.placename" content="Solothurn" />
<meta name="geo.position" content="46.81819;8.22751" />
<meta name="ICBM" content="46.81819, 8.22751" />
Skripte
JavaScript
Async: JS im Head sollte grundsätzlich immer async geladen werden, da es einfach nebem dem DOM Rendering laden ohne zu blockieren. Ausnahme: JS Funktion Trigger wird bei async gerendert bevor die JS Funktion geladen wurde.
Defer: JS wird erst als letztes geladem.
<script src="demo_async.js" async></script>
<script src="demo_defer.js" defer></script>
<script src="demo.js"></script>
Fazit: Falls Funktionen schneller aufgerufen als geladen werden sollten Sie den Aufbau Ihrer Seite nochmals überdenken.