Integration des IES in den Apache

Aus SiteparkWiki
Zur Navigation springen Zur Suche springen

Allgemeines

Der IES ist i.d.R. für sämtliche Dateien im DocumentRoot eines Publishers zuständig. Die Dateien werden entsprechend über den Nutzer des IES angelegt. Da jedoch der Apache diese lesen bzw. über PHP verändern / ergänzen können sollte, empfehlen wir die Zugriffsrechte entsprechend einzustellen. Unter Linux kann das einfach erreicht werden, indem der Nutzer des Webservers auch in die Gruppe ies aufgenommen wird. Die UMASK des IES ist entsprechend voreingestellt.

Konfiguration des DocumentRoot

Im DocumentRoot eines Publikationsbereiches werden neben den eigentlichen Artikeldaten auch noch Systemdaten der IES-Module gespeichert. Diese dienen u.a. zum Aufbau einer Sitemap o.ä. Damit diese vor direkten URL-Aufrufen geschützt werden können, werden entsprechende .htaccess-Dateien durch die Module generiert. Hierzu muss im Apache (und im Microsoft IIS über die Erweiterung Helicon Ape) die Auswertung dieser Daten erlaubt werden.

Da der IES sämtliche Daten der Module in das Unterverzeichnis /WEB-IES/ speichert ist die Konfiguration wie folgt möglich:

<VirtualHost *:80>
	<Directory "....$PATH_TO_DOCUMENT_ROOT.../WEB-IES">
		Options -Indexes
		AllowOverride LIMIT
	</Directory>
</VirtualHost>

Allgemeine Hinweise zur Integration

Die Integration des IES in den "Internet Information Server" von Microsoft ist über den sog. JK-Connector prinzipiell möglich. Weitere Informationen hierzu finden Sie im Internet

Grundsätzlich empfehlen wir sowohl unter Linux, wie auch unter Windows den Einsatz des Apache-Webservers, da wir aufgrund unserer Erfahrungen hier den besten Support liefern können.

Für die optionale Integration des IES in den Apache Webserver empfehlen wird das Apache-Modul proxy_http. Folgende Konfiguration kann als Vorlage dienen. Die ProxyPassMatch Anweisungen sind jedoch erst ab der Version 2.2.5 verfügbar.

Folgende Module sind für die unten aufgeführten Konfigurationsvorlagen notwendig:

   mod_proxy
   mod_proxy_balancer
   mod_proxy_http
   mod_lbmethod_byrequests # ab Apache 2.4 für proxy notwendig!!!
   mod_rewrite
   mod_ssl
   mod_headers 


Da Passwörter und andere vertrauliche Daten mit dem IES ausgetauscht werden, muss immer HTTPS für den Apache eingerichtet werden.

Hinweise zur Integration des IES in den Apache

Für die Integration des IES in den Apache sollte ein eigener Virtueller Host eingerichtet werden. Für diesen Virtueller Host ist kein DocumentRoot notwendig!

IES Apache-Konfiguration

<VirtualHost *:80>

    ServerName <<cms-host>>

    # Alle gültigen IES-Anfragen, die auf Port 80 erfolgen, sollten vollständig an Port 443 umgelenkt werden. Diese Aufrufe können zum einen durch
    # Redakteure erfolgen, die häufig URLs ohne "https" eingeben, zum anderen aber auch durch Aufrufe, die durch SPML- bzw. JSP-Seiten erzeugt werden,
    # da diese intern über "http" auf Port 8080 bearbeitet werden und keine Informationen dazu haben, dass SSL von Außen eingesetzt wird.
    RedirectMatch  ^(.*)$ https://<<cms-host>>$1

</VirtualHost>
<VirtualHost *:443>

    ServerName <<cms-host>>

    ErrorLog        /var/log/apache2/<<cms-host>>.err
    CustomLog       /var/log/apache2/<<cms-host>>.log combined

    # Infosite redirect
    RewriteEngine On
    RewriteRule ^/$ /ies/infosite/ [R,L]


    ###################################
    # IES integration using mod_proxy #
    ###################################

    # security
    ProxyRequests Off

    # timeout
    ProxyTimeout 3600

    # always keep the host header
    ProxyPreserveHost On

    # load balancer
    <Proxy balancer://ies-balancer>
        Order Deny,Allow
        Allow from All
        BalancerMember http://localhost:8080 timeout=3600 retry=0
    </Proxy>

    ProxyPassMatch ^(/ies/.*)$                               balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    ProxyPassMatch ^(/infosite-webdav/.*)$                   balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    ProxyPassMatch ^(/xip/.*)$                               balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    ProxyPassMatch ^(/infosite/.*)$                          balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On

    # Innerhalb eines Virtuellen Hosts für HTTPS sollte immer der Header X-IES-SCHEME auf https gesetzt werden, da nur so
    # innerhalb von IES-Applikationen ${system.baseurl} richtig aufgelöst wird. Weitere X-IES Header-Angaben sind i.d.R. nicht notwendig
    #RequestHeader set X-IES-SERVER-NAME "ies.intern.net" # evtl. abweichender ServerName
    #RequestHeader set X-IES-SERVER-PORT "1443" # evtl. abweichender Port
    RequestHeader set X-IES-SCHEME "https"

</VirtualHost>


Hinweise zur Integration von IES-Anfragen in dem Apache des Webservers

Webseiten-Apache-Konfiguration mit Zugriff auf den lokalen Webnode

Für Zugriffe des Apache auf den lokalen IES-Webnode (z.B. für Solr-Suchen) ist folgende Konfiguration notwendig:

<VirtualHost *:80>
...
   ProxyTimeout 3600
   <Proxy balancer://ies-webnode-balancer>
      Order Deny,Allow
      Allow from All
      BalancerMember http://localhost:8381
   </Proxy>
   ProxyPassMatch ^(/ies-webnode/.*)$      balancer://ies-webnode-balancer$1
...
</VirtualHost>

Webseiten-Apache-Konfiguration mit IES-API Zugriff

Dies Konfiguration ist notwendig für:

  • den I-Link im SRPC-Modus in InfoSite6
  • Module und Komponenten mit Live-Abfragen (zB. Verzeichnismodul mit der Möglichkeit Objekte anzulegen)
  • CityCall mit Anbindung an das Ticketsystem
<VirtualHost *:80>

    ServerName <<hostname>>
    DocumentRoot ...
 
    ErrorLog        ...
    CustomLog       ...
    ...

    ###################################
    # IES integration using mod_proxy #
    ###################################

    # security
    ProxyRequests Off

    # always keep the host header
    ProxyPreserveHost Off

    # timeout
    ProxyTimeout 3600

    # load balancer IES-API
    <Proxy balancer://ies-api-balancer>
        Order Deny,Allow
        Allow from All
        # Wenn lokal: BalancerMember http://localhost:8080 timeout=3600 retry=0
        BalancerMember https://<<cms-host>>:443 timeout=3600 retry=0
    </Proxy>

    ProxyPassMatch ^(/ies/api/.*)$                         balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    ####### oder auf bestimmte Module begrenzt: ######
    # ProxyPassMatch ^(/ies/MODUL/.*)$                       balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # Beispiele: 
    # ProxyPassMatch ^(/ies/formservice/.*)$                 balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # ProxyPassMatch ^(/ies/infoticket/.*)$                  balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # ProxyPassMatch ^(/ies/jslibs/.*)$                      balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On

</VirtualHost>

Webseiten-Apache-Konfiguration für Publikationsbereiche mit Live-Komponenten

Publikationsbereiche des IES die Live-Komponenten verwenden und somit auf den IES zugreifen müssen, werden wie folgt konfiguriert.

<VirtualHost *:80>

    ServerName ...
    DocumentRoot ...
 
    ErrorLog        ...
    CustomLog       ...

    ...

    ###################################
    # IES integration using mod_proxy #
    ###################################

    # security
    ProxyRequests Off

    # always keep the host header
    ProxyPreserveHost On

    # timeout
    ProxyTimeout 3600

    # Bei Zugriff auf BalanceMember via HTTPS einzelne Setzungen aktivieren
    #SSLProxyEngine On
    #SSLProxyVerify none
    #SSLProxyCheckPeerCN Off
    #SSLProxyCheckPeerName Off
    #SSLProxyCheckPeerExpire Off


    # load balancer
    <Proxy balancer://ies-balancer>
        Order Deny,Allow
        Allow from All
        BalancerMember http://<<cms-host>>:8080 timeout=3600 retry=0

        # Alternativ kann auch direkt der Apache des CMS-Systems angesprochen werden,
        # da dieser Anfragen automatisch intern an den IES weiterleitet.
        #BalancerMember http://<<cms-host>>:80 timeout=3600 retry=0

        # Bei Zugriff via SSL empfehlen wir die Verschlüsselung über den Apache zu konfigurieren.
        # Dieser leitet dann die unverschlüsselte Anfrage an den lokalen IES (intern über Port 8080)
        # Wird der BalanceMember via HTTPS angesprochen muss noch SSLProxyEngine auf ON gesetzt werden (s.o.)
        #BalancerMember https://<<cms-host>>:443 timeout=3600 retry=0
    </Proxy>

    # Der Ordner, der am Publisher für SPML-Live-Seiten konfiguriert wurde muss für "<<spml_live_folder>>" eingesetzt werden
    ProxyPassMatch ^(/<<spml_live_folder>>/.*\.spml(;jsessionid=\w+)?(\?.*)?)$  balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    ProxyPassMatch ^(/<<spml_live_folder>>/ies/binary/.*)$                      balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    # danach sollte, um die taglibs und andere für den IES notwendigen Elemente NICHT vom Apache ausliefern zu lassen, der Zugriff durch den Apache verboten werden
    <Directory <<DocumentRoot>>/WEB-INF>
      Order deny,allow
      Deny from all
    </Directory>


    # COUNTER 
    # Variante 1: RedirectMatch auf den Server (CMS muss öffentlich erreichbar sein)
    #RedirectMatch  ^/ies/counter(.*) https://<<cms-host>>/ies/infosite/counter$1

    # Variante 2: Rewrite, wenn über eine RewriteCondition noch Bedingungen angegeben werde sollen.
    # Rewrite um die Counter-Aufrufe (unabhaengig von Aliases) an das CMS (mit der konfigurierten Publisher-URL) zu schicken
    RewriteEngine on

    # Zugriff auf das CMS nur über den Webserver (als Proxy)
    RewriteRule ^/ies/counter(.*)           https://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind
    RewriteRule ^/infosite/counter(.*)      https://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind
    RewriteRule ^/ies/infosite/counter(.*)  https://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind

</VirtualHost>

Alternative Variante, wenn IES-API UND SPML-Seite unterstützt werden müssen

Für den I-Link im SRPC-Modus in InfoSite6 muss der Zugriff auf die IES-API konfiguriert werden.

Die Setzung ProxyPreserveHost legt fest, ob der ursprünglich im Request übergebene Hostname auch beim Proxy-Request angegeben wird, oder ob der Hostname der Balancer-Konfiguration verwendet wird.

Die Proxy-Regeln leiten alle relevanten Anfragen an den CMS-Server weiter. Je nach Ziel-Port, der in der Balance-Konfiguraion angegeben wird, wird der Request an den Apache oder den IES auf dem CMS-Server weitergeleitet. Wir empfehlen hier die Kommunikation über den Apache (Port 80 bei internen Requests, sonst Port 443). Soll der Zugriff direkt auf den IES erfolgen, ist folgende Anpassung der Bind-Address in der sitepark.conf notwendig: IES_BIND_ADDRESS="0.0.0.0" erforderlich. Damit ist der IES aber auch von allen anderen Rechern aus direkt erreichbar.

Im IES sind alle Domains und Aliase in den Publisher-Konfigurationen automatisch für HTTP-Anfragen gebunden, wenn diese für Live-Abfragen aktiviert wurden (Publikationsbereich als Modul verwenden - Wir raten in diesem Zusammenhang dringend zu der Einschränkung auf ein bestimmtes Verzeichnis). Das bedeutet, dass alle Anfragen an eine der in den Publishern konfigurierten Domains, die an den IES geleitet werden, über den IES mit entsprechenden DocumentRoot ausgeführt werden. Aufrufe von IES-Modulen sind mit diesen URLs damit daher nicht möglich. Sollen direkt Funktionen des IES (z.B. InfoSite oder IES-API) angesprochen werden, muss der IES über einen Domain-Namen oder eine IP aufgerufen werden, die in keinen Publisher konfiguriert wurde.

Damit nun sowohl Live-Abfragen (SPML-Seiten im DocumentRoot eines Publishers), als auch IES-Funktionen (wie die IES-API) von einer URL aufgerufen werden können ist ein kleiner Umweg notwendig, der hier beschrieben werden soll:

Es ist für jede Domain, für die diese zwei Formen des Zugriffs auf den IES notwendig sind, ein eigener Domain-Name, der auf den CMS-Server zeigt notwendig. Dieser kann entweder im DNS oder auch nur in den HOST-Dateien des CMS- und Webservers eingetragen werden. Weiterhin wird dieser Domain-Name über IES-Admin als Alias im entsprecheden Publisher konfiguriert. Auch sollte der Domain-Name im Apache als ServerAlias für den IES konfiguriert werden.

Unterschiedliche Balancer-Regeln auf dem Webserver sorgen nun dafür, dass so entwerder IES-Funktionen oder Live-Funktionen des Publishers ausgeführt werden, indem entweder die Alias-URL des Publishers oder die URL des IES verwendet wird.

In dem unten aufgeführten Beispiel wird die Kommunikation via HTTPs realisiert. Der Domain-Name <<ies-alias-hostname>> und CMS-Host <<cms-host>> ist entsprechend zu ersetzen.

Beispiel:

www.stadt-goldenberg.de
<<cms-host>: ies.stadt-goldenberg.de
<<ies-alias-hostname>>: ies-www.stadt-goldenberg.de
<<spml_live_folder>>: /live
<VirtualHost *:80>

    ServerName <<hostname>>
    DocumentRoot ...
 
    ErrorLog        ...
    CustomLog       ...

    ...

    ###################################
    # IES integration using mod_proxy #
    ###################################

    # security
    ProxyRequests Off

    # always keep the host header
    ############# WICHTIG: muss auf 'Off' stehen, damit der Wert des Balancers übertragen wird #################
    ProxyPreserveHost Off

    # Bei Zugriff auf BalanceMember via HTTPS einzelne Setzungen aktivieren
    SSLProxyEngine On
    SSLProxyVerify none
    SSLProxyCheckPeerCN Off
    SSLProxyCheckPeerName Off
    SSLProxyCheckPeerExpire Off

    # timeout
    ProxyTimeout 3600

    # load balancer IES
    <Proxy balancer://ies-balancer>
        Order Deny,Allow
        Allow from All
        ############# WICHTIG: Es muss der richtige Hostname gesetzt werden #################
        BalancerMember https://<<ies-alias-hostname>>:443 timeout=3600 retry=0
    </Proxy>

    # Der Ordner, der am Publisher für SPML-Live-Seiten konfiguriert wurde muss für "<<spml_live_folder>>" eingesetzt werden
    ProxyPassMatch ^(/<<spml_live_folder>>/.*\.spml(;jsessionid=\w+)?(\?.*)?)$  balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    ProxyPassMatch ^(/<<spml_live_folder>>/ies/binary/.*)$                      balancer://ies-balancer$1 stickysession=JSESSIONID nofailover=On
    # danach sollte, um die taglibs und andere für den IES notwendigen Elemente NICHT vom Apache ausliefern zu lassen, der Zugriff durch den Apache verboten werden
    <Directory <<DocumentRoot>>/WEB-INF>
      Order deny,allow
      Deny from all
    </Directory>

    # load balancer IES-API
    <Proxy balancer://ies-api-balancer>
        Order Deny,Allow
        Allow from All
        # Wenn lokal: BalancerMember http://localhost:8080 timeout=3600 retry=0
        BalancerMember https://<<cms-host>>:443 timeout=3600 retry=0
    </Proxy>
    ProxyPassMatch ^(/ies/api/.*)$                         balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    ####### weitere Module ######
    # ProxyPassMatch ^(/ies/MODUL/.*)$                         balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # Beispiele: 
    # ProxyPassMatch ^(/ies/formservice/.*)$                balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # ProxyPassMatch ^(/ies/infoticket/.*)$                  balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On
    # ProxyPassMatch ^(/ies/jslibs/.*)$                      balancer://ies-api-balancer$1 stickysession=JSESSIONID nofailover=On

    # COUNTER 
    # Variante 1: RedirectMatch auf den Server (CMS muss öffentlich erreichbar sein)
    #RedirectMatch  ^/ies/counter(.*) https://<<cms-host>>/ies/infosite/counter$1

    # Variante 2: Rewrite, wenn über eine RewriteCondition noch Bedingungen angegeben werde sollen.
    # Rewrite um die Counter-Aufrufe (unabhaengig von Aliases) an das CMS (mit der konfigurierten Publisher-URL) zu schicken
    RewriteEngine on

    # Zugriff auf das CMS nur über den Webserver (als Proxy)
    RewriteRule ^/ies/counter(.*)           http[s]://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind
    RewriteRule ^/infosite/counter(.*)      http[s]://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind
    RewriteRule ^/ies/infosite/counter(.*)  http[s]://<<cms-host>>/ies/infosite/counter$1 [L,NE,P] # Proxy NICHT, wenn CMS- und Webserver ein Host sind

</VirtualHost>

Apache-Konfiguration Version < 2.2.5

Bei älteren Apache-Versionen (< Version 2.2.5) ist unter Umständen statt einer ProxyPassMatch eine RewriteRule einzusetzen:

###################################
# IES integration using mod_proxy #
###################################

# security
ProxyRequests Off

# always keep the host header
ProxyPreserveHost On

# timeout
ProxyTimeout 3600

# load balancer
<Proxy balancer://ies-balancer>
    Order Deny,Allow
    Allow from All
    BalancerMember http://localhost:8080 timeout=3600 retry=0
</Proxy>

RewriteEngine On
RewriteRule ^(/<<spml_live_folder>>/.*\.spml(;jsessionid=\w+)?(\?.*)?) balancer://ies-balancer$1 [P]
RewriteRule ^(/<<spml_live_folder>>/ies/binary/.*)$ balancer://ies-balancer$1 [P]
# danach sollte, um die taglibs und andere für den IES notwendigen Elemente NICHT vom Apache ausliefern zu lassen, der Zugriff durch den Apache verboten werden
<Directory <<DocumentRoot>>/WEB-INF>
  Order deny,allow
  Deny from all
</Directory>

RewriteRule ^(/infosite-webdav/.*)$ balancer://ies-balancer$1 [P]

# Innerhalb eines Virtuellen Hosts für HTTPS sollte immer der
# Header X-IES-SCHEME auf https gesetzt werden,
# da nur so innerhalb von IES-Applikationen ${system.baseurl}
# richtig aufgelöst wird.
#RequestHeader set X-IES-SCHEME "https"

Counter Konfiguration für einen Virtual-Host, der von verschiedenen CMS-Server geschrieben wird (z.B. für CityCall115).

In der Virtual-Host Konfiguration des Webservers genügt dieser Eintrag für die Weiterleitung der Counter-Aufrufe:

...
 # Alle Counter-Requests an eine vom CMS gepflegte PHP-Seite:
 RewriteRule ^/ies/counter(.*) /counter.php$1 [L,NE]
...

Hier der Inhalt der php Seite 'counter.php' am Beispiel CityCall für Wuppertal/Remscheid/Solingen

<?php
  if (!empty($_GET)) {
    $client = substr(htmlspecialchars($_GET["SYS_CNTR_id"]),0,5);
    $prefix = "";

    // Für den Fall, dass es auch auf Testservern eingesetzt wird
    if (strrpos($_SERVER['SERVER_NAME'],"test")) {
      $prefix = ".test";
    }

    $url = null;

    //
    // Unterscheide anhand der Server- und ClientId des übergebenen 
    // Counter-Artikels die Server für die Weiterleitung

    // Wuppertal
    if ($client === "10237") {
      $url = "http://cms-w".$prefix.".wuppertal.de/ies/infosite/counter";

    // Remscheid
    } else if  ($client === "14638") {
      $url = "http://cms-rs".$prefix.".remscheid.de/ies/infosite/counter";

    // Solingen
    } else if  ($client === "15601") {
      $url = "http://cms-sg".$prefix.".solingen.de/ies/infosite/counter";
    }

    // Die Parameter des Aufrufes ergänzen und die Seite mit einem Timeout (3 bis 5 Sekunden) aufrufen. 
    if ($url !== null) {
      $url .= "?".$_SERVER['QUERY_STRING'];

      $context  = stream_context_create(array("http" => array("timeout" => 3)));
      return file_get_contents($url, NULL, $context);
    }
}
?>