Viele Unternehmen setzen eine Art Internet-Firewall ein, aber Schulen haben die einzigartige Verpflichtung, eine umfassendere Filterung von Internet-Inhalten auf ihren Schülerarbeitsplätzen bereitzustellen. Die Inhaltsfilterung kann in einer Vielzahl von Methoden angewendet werden, und die meisten Inhaltsfilterungstechnologien verwenden eine Kombination mehrerer Methoden. Die Inhaltsfilterung kann verwendet werden, um den Zugriff auf Pornografie, Spiele, Einkaufen, Werbung, E-Mail/Chat oder Dateiübertragungen oder auf Websites zu blockieren, die Informationen über Hass/Intoleranz, Waffen, Drogen, Glücksspiel usw. bereitstellen.
Die einfachste Methode zur Inhaltsfilterung ist die Angabe von a schwarze Liste. Eine Blacklist ist nichts anderes als eine Liste von Domains, URLs, Dateinamen oder Erweiterungen, die der Inhaltsfilter blockieren soll. Wenn beispielsweise die Domain Playboy.com auf die schwarze Liste gesetzt wird, wird der Zugriff auf diese gesamte Domain blockiert, einschließlich aller Subdomains oder Unterordner. Im Falle einer auf der schwarzen Liste stehenden URL, wie z. B. en.wikipedia.org/wiki/Recreational_drug_use, könnten andere Seiten der Domain verfügbar sein, aber diese bestimmte Seite wäre blockiert. Oft können Platzhalter verwendet werden, um große Mengen von Domains und URLs mit einfachen Einträgen wie *sex* zu blockieren. Blacklisting kann auch verwendet werden, um Softwareinstallationen zu verhindern, indem der Zugriff auf Dateien wie */setup.exe blockiert wird, oder um Änderungen am Computer zu verhindern, indem potenziell schädliche Dateitypen wie *.dll oder *.reg blockiert werden. Da Inhaltsfilter noch nicht zwischen Kunst und Porno unterscheiden können, sind viele Inhaltsfilter auch so konfiguriert, dass sie Grafikdateitypen wie *.gif, *.jpg, *.png usw. blockieren.
EIN Weiße Liste ist das Gegenteil einer schwarzen Liste; es ist eine Liste von Ressourcen, die der Inhaltsfilter passieren lassen sollte; Wie ein Türsteher am Samtseil blockiert der Inhaltsfilter alle Ressourcen, die nicht auf der Whitelist aufgeführt sind. Blacklists und Whitelists können in Verbindung miteinander verwendet werden, um eine granularere Filterung bereitzustellen; Die schwarze Liste könnte zum Beispiel verwendet werden, um alle Grafikdateitypen zu blockieren, aber die weiße Liste könnte so konfiguriert werden, dass sie die schwarze Liste für Bilder außer Kraft setzt, die von bestimmten, moderierten oder gesponserten, altersgerechten Bildhostingdiensten stammen. Blacklisting und Whitelisting sind schnelle und einfache Methoden, um festzustellen, ob eine bestimmte Website angezeigt werden soll oder nicht. Das Abgleichen einer Website mit einer Liste ist nicht prozessorintensiv, daher kann es schnell durchgeführt werden, aber es ist auch nicht robust, da ständig neue Websites auftauchen, und es gibt keine Möglichkeit, dass irgendjemand jemals den Überblick behalten kann, wenn alle hinzugefügt werden die schlechten auf eine schwarze Liste.
Was machen wir also mit diesem kontinuierlichen Strom neuer Websites, die online gehen? Hier kommen fortgeschrittenere Filtermethoden ins Spiel. Parsing kann verwendet werden, um nach bestimmten Wörtern oder Sätzen auf einer Webseite zu suchen. Anstatt sich ausschließlich auf das Filtern nach Adresse zu verlassen, lädt der Inhaltsfilter die angeforderte Website herunter (sofern sie nicht sofort durch eine schwarze Liste blockiert wird) und liest jede Zeile davon und scannt nach schlechten Wörtern oder Phrasen. Eine Liste mit schlechten Wörtern oder Ausdrücken wird spezifiziert, konzeptionell wie eine schwarze Liste, aber diese Liste würde auf übereinstimmende Muster in der Webseite überprüft, was mehr Prozessorzeit erfordert und die Bereitstellung von Webseiten verlangsamt. (Tatsächlich bin ich mir sicher, dass es in diesem Moment bereits einige Inhaltsfilter gibt, die sich davor scheuen, genau diesen Artikel anzuzeigen, nur weil er das Wort Sex im vorherigen Absatz enthält, und wenn das nicht reicht, sehen Sie sich an, was es ist kommt als nächstes…) Eine typische Liste von schlechten Wörtern und Ausdrücken könnte „boobies“ enthalten, aber da Webautoren genauso daran interessiert sind, dass ihre Inhalte Filter passieren, wie Administratoren daran interessiert sind, sie fernzuhalten, kann es notwendig sein, auch odd einzufügen -scheinbare Sorten wie b00bies, boob!es oder boobie$. Die Filterung kann so eingestellt werden, dass alle Seiten blockiert werden, die irgendwelche der schlechten Phrasen enthalten, oder Phrasen können Punktwerte zugewiesen werden, und der Filter könnte so eingestellt werden, dass er alle Seiten blockiert, die eine bestimmte Punktschwelle überschreiten.
Die nächste Methodik der Inhaltsfilterung wird aufgerufen Kontextfilterung, und es setzt dort an, wo die Wort- und Satzanalyse aufhört. Das Problem beim Parsing von Wörtern und Phrasen ist, dass es nicht sehr schlau ist. Es wirkt einfach auf alles, was einem vordefinierten Muster entspricht, ohne Rücksicht auf den Kontext. Es könnte Seiten blockieren, die die Begriffe „die nackte Wahrheit“ oder „Hähnchenbrust“ enthalten, während sich ein Administrator in diesen Kontexten möglicherweise weder um „nackte“ noch „Brüste“ kümmert, aber vielleicht Seiten mit den Wörtern „nackte Brüste“ blockieren möchte ,“ wenn sie zusammen verwendet werden. Sogar durch die Zuweisung von Punktwerten und Schwellenwerten können legitime Webseiten blockiert werden.
Zum Beispiel könnte eine Webseite über Brustkrebs leicht genug oft auf Brüste verweisen, um einen Punkteschwellenwert zu überschreiten. Die Kontextfilterung wird durch eine Vielzahl proprietärer Algorithmen durchgeführt, die von den verschiedenen Herstellern von Internetinhaltsfiltern entwickelt wurden. Der Trick besteht darin, dass sie Geschwindigkeit und Genauigkeit ausbalancieren müssen; Sie müssen alle Formulierungen der angeforderten Webseiten herunterladen und sorgfältig analysieren, um festzustellen, ob sie akzeptabel oder tabu sind, und sie müssen dies schnell genug tun, um den Benutzern weiterhin so transparent wie möglich zu erscheinen. Wenn sie zu schnell urteilen, lassen sie möglicherweise inakzeptable Inhalte durch (bekannt als „Fehltreffer“) oder blockieren akzeptable Inhalte (bekannt als „falsche Treffer“), aber wenn sie zu nachdenklich sind, werden sich Benutzer über Latenz beschweren. Das Erstellen eines besseren Algorithmus erfordert mehr Zeit und Geld, daher kosten schnellere und genauere Filter häufig mehr.
Nur der Vollständigkeit halber sollte ich in dieser Abhandlung über das Filtern von Internet-Inhalten auch erwähnen, dass es andere Methoden geben kann, die in verschiedenen Lösungen zum Filtern von Internet-Inhalten verwendet oder konfiguriert werden können. Praktisch alle Internet-Content-Filter arbeiten auf Port 80 (http); Die meisten ignorieren andere Protokolle, aber einige können möglicherweise Filter auf andere Ports anwenden oder bestimmte Ports wie FTP oder Telnet vollständig herausfiltern. (Ich frage mich, welchen Port „World of Warcraft“ verwendet …)
Ähnlich wie bei Firewalls sollte ich auch darauf hinweisen, dass Internet-Inhaltsfilter als Hardware- oder Softwarelösungen erhältlich sind. Hardwarelösungen sind allgemein als „Appliances“ bekannt, und Softwarelösungen sind allgemein als „Anwendungen“ oder „Dienste“ bekannt. Hardwarelösungen sorgen für eine zentralisierte Verwaltung. Sie kosten zwar mehr, führen aber die gesamte filterbezogene Verarbeitung durch, um Ihre Server und Workstations von solchen Verantwortlichkeiten zu entlasten. Sie werden häufig mit Abonnementdiensten für Updates der Blacklist, Whitelist, Phrasenliste und Kontextdaten geliefert, ähnlich wie Antivirus-Abonnements Updates für Listen mit Virensignaturen bereitstellen. Sie können mehrfach vernetzte Pass-Through-Gateways sein oder den Datenverkehr an einen bestimmten Port oder eine bestimmte Ziel-IP-Adresse umleiten.
Höherwertige Modelle können auch Caching beinhalten, um die Bereitstellung häufig aufgerufener Ressourcen zu beschleunigen. Softwarebasierte Lösungen können serverbasiert sein oder auf jeder einzelnen Arbeitsstation installiert werden. Die meisten Serverinstallationen bieten die gleiche zentralisierte Verwaltung wie Hardwarelösungen, aber natürlich verwenden sie Ihren Prozessor und RAM, um die Filterung durchzuführen, anstatt eine dedizierte Appliance zu sein. Folglich können sie weniger teuer sein. Im Falle einer Workstation-Installation müssen Sie neben der Installation der Software auf jeder einzelnen Workstation möglicherweise auch jede Workstation einzeln konfigurieren und jede Workstation regelmäßig einzeln aktualisieren.
Sogar Microsoft Internet Explorer hat einen kostenlosen, einfachen, integrierten Internetinhaltsfilter – er heißt „Content Advisor“, und Sie können ihn unter Internetoptionen in der Windows-Systemsteuerung konfigurieren. Es ist in Ordnung für den eigenständigen Computer Ihres Kindes oder ein kleines Peer-to-Peer-Netzwerk, ist aber wahrscheinlich als Unternehmenslösung unzureichend. Ob hardware- oder softwarebasiert, erstklassige Unternehmenslösungen sind häufig in Active Directory integriert, was die Verwaltung und Konfiguration vereinfacht und Filtereinstellungen ermöglicht, um Benutzern überall im Netzwerk zu folgen. Lehrer könnten beispielsweise weniger restriktive Einstellungen haben, unabhängig davon, wo sie sich anmelden, während Schüler weiterhin blockiert werden könnten, selbst wenn sie sich während der Pause in die Fakultätslounge schleichen.