[\p{So}\p{Sk}]+是一个正则表达式,表示匹配一个或多个Unicode符号和特殊字符。
\p{So}表示Unicode中的“其他符号”(如音符、货币符号等),
\p{Sk}表示Unicode中的“符号标记”(如重音符、变音符等)。
+表示匹配一个或多个前面的字符。
def remove_emoji(msg:String):String={
val regex = """[\p{So}\p{Sk}]+"""
val msg_new = msg.replaceAll(regex, "")
msg_new
}