Umlaute enthalten nicht sichtbare Zeichen

  • Hallo,

    ich möchte gern die Umlaute aus einem Dateiupload entfernen.
    Das funktioniert an sich auch soweit ganz gut, bis ich auf einen Dateinamen stieß, der ein falsch(?) formatiertes ü hatte. Es sieht auch ganz normal aus, aber mit einem regulären Ausdruck kann ich es nicht mit einem normalen ü vergleichen.


    Wenn ich das spezielle ü kopiere und z.B. in einen Text-Converter (https://www.branah.com/ascii-converter) einfüge, erhalte ich als dezimalwert 117776 anstatt 252.

    Das seltsame ist auch, dass ich einmal hinter dem ü löschen kann und es dann nicht gelöscht wird, sondern nur die Ü-Punkte.

    Was ich jetzt gerne wissen würde ist, kann man solche Zeichen generell herausfiltern oder gar vermeiden?

    Glück auf!