PHP-DOM-Dokument LoadHTMLFile wird durch Klammern unterbrochen

  • Ich arbeite an einem PHP-Parser, der die HTML-Gruppen-Seite meiner Schule analysiert. Dies sind Seiten mit einer eindeutigen URL, die auf dem Namen des Kurses und mehreren anderen Variablen basiert. Die Seite besteht aus einer Reihe von HTML <table> s.

    Das Laden des HTML-Codes von der URL funktioniert einwandfrei, bis im Inhalt der Datei ein ) erscheint. Dann hört es einfach auf zu laden und speichert nur das, was es bisher erhalten hat. Natürlich wurde der geladene HTML-Code nicht von mir erstellt, und ich kann nicht verhindern, dass solche Zeichen im HTML-Code enthalten sind.

    Es funktioniert jedoch gut, wenn ich es lokal mit laufe MAMP. Ich habe versucht, nach Antworten zu suchen, habe aber nichts gefunden, das mein Problem gelöst hat.

    Wie kann ich diese Zeichen vor dem Laden entziehen?

    Mein aktuelles PHP:

     $dom = new DOMDocument; 
    libxml_use_internal_errors(true); // the HTML i parse contains a lot of unclosed tags, this to prevent the errors from displaying on the page
    $dom->loadHTMLFile('http://isarog.hhs.nl/Web_Site/HHS/ICTM/Public/Iris_Roster/Timetables/11_2/11_2-CMD-4vt-p2.html');   
    
    echo $dom->getElementsByTagName('html')->item(0)->nodeValue;
     
    22 November 2011
    Joey
0 answers