重要な小さなこと。 単語間にスペースのない言語 (アジアなど) では単語が壊れていますか? 漢文の歴史

16

MySQL の全文検索を日本語や中国語、その他の言語でも機能させたいと考えています。 問題は、これらの言語、そしておそらく他の言語では通常、単語の間にスペースが存在しないことです。 本文と同じ文章を入力する必要がある場合、検索は役に立ちません。

英語も必要なので、各文字の間にスペースを入れることはできません。 この問題をPHPまたはMySQLで解決したいと考えています。

独自のインデックスとなる文字を認識するように MySQL を構成できますか? これらの文字を認識して、インデックスの周囲のスペースを削除できる PHP モジュールはありますか?

部分的な解決策:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00"")."-".json_decode(""\uface"")."]/", " $0 ", $string_without_spaces);

これにより、特別に処理する必要がある少なくとも一部の文字から文字クラスが作成されます。 おそらく、インデックス付きテキストをスキップすることは許容されると言及する必要があるでしょう。

プローブに挿入する必要がある文字の範囲をすべて知っている人はいますか?

また、これらの文字を PHP で表現するための、より優れた移植可能な方法はないでしょうか? リテラル Unicode のソース コードは完璧ではありません。 すべての文字を認識できるわけではありません。 使用する必要があるすべてのマシンに表示されない可能性があります。

3

単語間にスペースを使用しない他の現代言語には、タイ語、ラオス語、クメール語 (カンボジア)、ビルマ語 (ミャンマー) があります。 ベトナム語では、外来語を除くすべての音節間にスペースが使用されるという関連した問題があります。 - ヒッピートレイル 12月18日 10 2010-12-18 12:48:10

  • 2 つの答え
  • 並べ替え:

    活動

15

言及されている言語の単語違反には必須が必要です 言語学的アプローチ 、たとえば、 辞書基本的な理解とともに ルールが生まれる.

エンドユーザーが提供した検索条件と同じ「トークン化」を適用するだけで、個々の文字を中国語の個別の単語として分離するだけで、比較的成功した全文検索アプリケーションについて聞いたことがあります。 検索エンジンは、検索基準と同じ順序で単語文字を提供するドキュメントに対して、より良いランキングを提供します。 ひらがなやカタカナの文字セットにより、テキストが短いアルファベットのヨーロッパ言語に似たものになるため、これを日本語のような言語に拡張できるかどうかはわかりません。

編集:
リソース
この言葉は問題やそれに関連する問題を分解するためのものです。 重要な本全体がそれについて書かれているということ。 たとえば、CJKV 情報処理を参照してください (CJKV は中国語、日本語、韓国語、ベトナム語を表します。多くのテキストではベトナム語について説明していないため、CJK キーワードを使用することもできます)。 「日本語の単語の区切りは、このトピックに関する概要資料としては難しい」も参照してください。
このトピックをカバーする資料のほとんどは、母国語の主要言語のいずれかで書かれているため、これらの言語に比較的習熟していない人々に限定されることは明らかです。 このため、検索エンジンのテストを容易にするために、ワード ブレーク ロジックの実装を開始したら、ネイティブ スピーカー 1 人か 2 人の助けを求める必要があります。

いろいろなアイデア
あなたの案 単語の区切りを体系的に暗示する特徴を特定する(引用符、括弧、ハイフンのような記号など) は適切であり、これはおそらく一部の専門的な単語区切りで使用されるヒューリスティックの 1 つです。 ただし、そのようなリストについては、事例報告に基づいて最初から作成するのではなく、信頼できる情報源を探す必要があります。
関連するアイデアは、単語を次のように分割することです。 かなから漢字への移行(しかし、その逆はないと思います)そしておそらく ひらがなからカタカナへまたはその逆の遷移。
壊れた正しいものとは関係なく、インデックスは、たとえば、各ひらがな文字を対応するカタカナ文字に体系的に変換することで恩恵を受ける場合があります [-またはそうでない場合もあります- ;-)]。 ただの無教養な考えだ! 私は日本語についてあまり詳しくないので、これが役に立つかどうかわかりません。 直観的には、これは、ヨーロッパのいくつかの言語で行われている、アクセント付き文字の体系的な変換、つまり対応するアクセントのない文字への変換と大まかに関連していると考えられます。

おそらく、個々の文字を体系的にインデックス付けする (そして、検索語への近似に基づいて検索結果をランク付けする) という先ほど述べたアイデアは、たとえば、連続するかな文字をまとめて保持し、その後に他のルールを適用するなど、わずかに変更できる可能性があります...しかし、非常に実用的な検索エンジンです。

そうでなくてもがっかりしないでください... 前述したように、これは決して簡単なことではなく、一時停止して 1 ~ 2 冊の本を読むことで、長期的には時間とお金を節約できます。 「理論」とベスト プラクティスについてもっと学ぼうとするもう 1 つの理由は、現時点では次のことに集中しているように見えるからです。 違反の言葉 しかし、近い将来、検索エンジンも恩恵を受ける可能性があります。 結果的意識 ; 実際、これら 2 つの質問は少なくとも言語的に関連しており、並行して処理すると役立つ可能性があります。

この不愉快ではあるが価値ある取り組みで幸運を祈ります。

0

@ジョー: どういたしまして。 私は言語学と NLP に興味があるようですが、CJK 言語に特有の知識はほとんどありません。 私の編集内容を読んで、検索に役立つキーワードとオンライン リンクを追加してください。頑張ってください :-) - mjv 10月22日 09

中国のプロジェクトに取り組んだり、中国でキャンペーンを立ち上げたりしたことがある人なら誰でも、現地のデザインの考え方が西洋のそれとは異なることを知っています。 例を遠くまで探す必要はありません。中国の国際ブランドで働いている場合、または中国で販売される製品を作成している場合は、Baidu.com または QQ.com を調べて、オンラインの中国語であなたのブランドがどのように表現されているかを確認してください。空間。

最大の違いは、サイトが非常に乱雑に見えることです。 ページを読めなくするように設計されていると思われるテキスト、リンク、さらにはアニメーションが大量にあります。

デジタルカオスのように見えるかもしれませんが、中国のウェブサイトはいくつかの理由からそのように設計されています。 中国でビジネスを立ち上げることを計画している場合は、現地の Web エクスペリエンスのいくつかの機能を学ぶことをお勧めします。

中国語は全く違う

まず、知っておくべきいくつかの事実を次に示します。

1. 中国語には大文字はありません。 西洋の読者は、テキスト内の大文字を識別して文の始まりと終わりを見つけるように訓練されています。 中国語のサイトが似たような文字の集合のように見えるのはこのためです

2. 文字間にスペースは入れません。 西洋言語では単語を区切るためにスペースが使用されますが、これは中国語でも使用されません。 ここでは、長い文字列はまったく正常ですが、西洋のユーザーにとっては混乱を招きます。

3. 生地は作りましたか?原理的には、すべてが明らかですよね? 文字が逆になっている単語は、最初と最後の文字が正しい位置にあり、完全に逆に書かれていない限り、読みやすいです。 このため、人々はすべての単語を読むのではなく、テキストを目でざっと流し読みします。 しかし、彼らは同じように中国語の文章をざっと読むことができないので(その文字が彼らになじみがないと仮定して)、そのような文字の行は彼らにとって特に混沌としているように見えます。

4. 中国語の文字は、ラテン文字やキリル文字よりもはるかに「密度」が高く、1 文字に平均 10 画が含まれているのに対し、1 画または 2 画です。 これにより、西洋のユーザーには中国語のテキストが「過負荷」に見えます。

次に不可解な特徴は、典型的な中国の Web サイトが 1 つの大きなリンクのように見えることです。 Sohu.com では、文字通りすべての文字がリンクの一部です。

これには 2 つの理論があります。 1 つ目は、アルファベット キーボードでは中国語の文字を入力するのが難しいため、ユーザーは検索ボックスを使用する代わりにリンクをクリックする傾向があるということです。

中国語の文字を入力するには、文字を描画するか、西洋文字を使用してピンインを書き写す必要があるため、これは非常に合理的です。

象形文字が書かれるか、その転写が印刷されると、記号のオプションが表示され、ユーザーはそこから正しいものを選択する必要があります。 これを何度も繰り返して検索するのはなかなか大変そうです。

しかし、別の理論もあります。 そして、中国語版の Google 検索を提供する検索エンジン Baidu の人気を考えると、それを信じる理由があります。 この理論によると、多くの中国人は依然として低速インターネットを使用しています。 アカマイの調査による統計もこれを裏付けています。

国およびインターネット速度に応じたオンライン人口の割合: 4 MB/秒未満、4 MB/秒以上、10 MB/秒未満、10 MB/秒以上

ご覧のとおり、中国人の 3 分の 2 は 4 Mbps 未満の接続速度でインターネットを使用しています。これは世界の平均速度よりも大幅に低く、西側諸国ではほとんど前例のない速度です。

結論として、インターネットの速度が比較的遅い場合、多くのリンクを含む 1 つのページを読み込み、新しいタブで開くのが合理的です。 これにより、ユーザーは、一度に 1 つずつページを読み込むのに時間がかかり、苦痛になることなく、並行してページを閲覧できるようになります。 ダイヤルアップ インターネット接続を覚えている人なら、私たちが何を言っているのか理解できるでしょう。

最後に、中国の Web サイトでは、点滅するテキストやバナーが多用されています。

その理由は、中国語では異なるフォントを使用して注目を集めることが西洋のテキストよりもはるかに難しいためであると思われます。 これには次のような多くの理由があります。

1. 漢字のフォントは数が少ないです。
2. イタリック体は存在せず、通常は太字も使用されません。
3. 最小フォント サイズ - 12 ピクセル

さらに(そしてここで文化的要素に目を向けますが)、中国人は単に西洋人よりも点滅するグラフィックスをあまり気にしていないように思えます。 その結果、私たちにとって過負荷に見えることは、彼らにとっては正常なことなのです。

さらに、西洋のサイトにポップアップが表示されるようになったことで、中国のリソースは以前ほど西洋のサイトと異なって見えなくなりました。

ついに

多くの試験参加者は、句読点やテキストの全体的な外観はスコアに影響しないため、無視できると信じています。 ただし、書かれた部分はコンピュータではなく、人間が自分の主観的な評価でチェックしていることを忘れないでください。 研究によると、エッセイの美しい体裁と句読点の正しい使用は、試験官にあなたの言語レベルの高さを示し、2 点から 10 点の加点となる可能性があります。

美しい外観とは、まず第一に、段落への正しい分割と見出しの強調表示です。
タイトルを書く場合は、最初の行の真ん中に入力する必要があります。 購読を希望される場合は、本文の最後またはタイトルのすぐ下に署名します。
テキストは段落に分割し、2 つのセルでインデントする必要があります。 。 新しい考えはすべて新しい段落です。

句読点の要件は何ですか??

中国語にはどのような句読点があるのか​​を思い出してみましょう。

1) ピリオド、句号 (。) は、句の終了後の休止を表します。

2) コンマ「逗号」 (,) はフレーズ内の休止を表しますが、すべてはそのままです。

3) カンマを削除 , 顿号(、)は列挙する際に文中の同種の構成要素の間に置かれます。
例えば、

  • - 私はスイカ、リンゴ、バナナが大好きです。

4) セミコロン分号 (;) は、複雑な文の各部分の間に一時停止を表します。

5) 疑問符 问号 (?) - 疑問文の終わりの後のポーズ。

6) 感嘆符感叹号 (!) - 強い感情を伝えるフレーズの終わりの後のポーズ。文を形成しない単語の後に単に使用することもできます。

7) コロン冒号 (:) は、次の文章への移行を意味します (たとえば、宛先に宛てた後の手紙など)。

8) 引用、特別な名称、または特に強調する必要がある部分を引用符引号(「……」または「……」)で囲みます。
ロシア語のように、比喩的な意味を持ち、皮肉や否定を伝えることもあります。

  • 「あなたの「親友」があなたの財布を盗みました。

単一要素引用符は、引用符内で引用符を再度使用する必要がある場合に使用されます。

9) そしてもう一度引用符、今度は书名号 (《……》) です。
名前が示すように、このような引用符は、本文中で言及されている書籍、記事、歌、映画などの名前を囲みます。 私たちは、尾とたてがみの両方でロシア語でのあらゆる種類の引用符の使用をやめ、书名号と引号を区別しています。
ちなみに、「书名号」にも括弧1つからの変化体があります。 たとえば、タイトルにタイトルが含まれる《記事》について言及する場合、<книги>.

  • - 私はちょうど「莫言小说〈酒国〉におけるポストモダンの特徴」というタイトルの記事を読み終えました。

10) 省略記号 (……) そうです、それは 6 つの点で構成されており、同じくらいの量を占めています 2つのセル文中に!
本文から一部の文章が省略されている、または優柔不断、不明瞭で不明瞭なことを表します。

11) ダッシュ破折号 (--)。
ご存知のとおり、中国語にはハイフンがありません (つまり、「3-4」は「三四个」、「中国語-ロシア語」は「汉俄」と表記されます)。 ただし、「一、一」という言葉があり、それと混同しないようにダッシュは 2つのセル.
ダッシュは、上に書かれた内容の説明が下にあることを意味します(ロシア語ではこの場合コロンを入れます!)。

12) 実は、括弧(……)は本文中のコメントを意味します。

コーナーのどこかにポイントを置くだけでは悪いアプローチです。
中国語では、句読点はセル全体を占めます。
省略記号とダッシュは 2 つのセル全体を占めます。
1 つの要素のすべての句読点 (ピリオド、コンマ、コロン、終わりの引用符と括弧) を行の最初に使用することはできません。また、開始引用符や括弧を行の最後に使用することはできません。

もちろん、句読点を使用する他の方法もありますが、句読点は文学的な文章でよく使われるため、テストでは必要ありません。

追記 レベル 3 ~ 5 を受講している場合は、「単語から文を作る」というタスクでは、最後に句読点 (ピリオド、感嘆符、疑問符) を付ける必要があることに特に注意してください。 そうしないと、スコアが減らされる可能性があります。

中国語を書くときにスペースを導入する利点

1. 読みやすさの向上: 単語の境界を追加すると、中国語のテキストを読むときの認知的負荷が軽減されます。 テキストがスペースなしで書かれている場合、読者は単語がどこで始まりどこで終わるのかを分析すると同時に、テキストの意味を理解しようとする必要があり、すでに難しい作業が複雑になります。

2. 中国語で書かれたテキストのより正確な機械処理: 中国語テキストのこのような処理を開始する前に、まずテキストをセグメント化する必要があります。 象形文字を使用する言語を処理する場合、これは簡単な作業ではありません。 あまり正確ではないが高速な機械による方法 (約 90%) と、より正確であるものの遅い方法 (約 94 ~ 97%) がありますが、完璧な方法はありません。
中国語の文章に単語の間にスペースがあれば、分割する必要がなくなり、中国語のテキストの機械処理がはるかに簡単になります。 その結果、中国語からの翻訳作業が大幅に簡素化されます。

3. 学生の中国語学習を容易にする: 単語の間にスペースを入れると、単語や文章が理解しやすくなります。 私が初めて中国語を勉強し始めたとき、中国語では単語間にスペースがないため単語の境界を理解することが難しく、辞書に存在しない単語を調べるのに多くの時間を費やしました。 単語の間にスペースを導入すると、中国語学習者はより速く、より効率的に語彙を構築できるようになります。

中国語のテキストでは単語の間にスペースが必要ないのはなぜですか?

1. 言葉とは何ですか? 中国語の「言葉」の概念は非常に曖昧です。 その単語はどこで始まり、どこで終わりますか? ロシア語 (およびアルファベットに基づくその他の言語) のネイティブ スピーカーにとっての単純な質問は、中国語のネイティブ スピーカーを混乱させる可能性があります。 たとえば、過去時制を示す助詞「了」は単語の一部とみなされるべきでしょうか?
たとえば、「小刘来了」という文では、スペースをどこに入れますか – 小刘_来了 または 小刘来_了?書き言葉の理解。

2. 伝統: 中国語の文字は 3,000 年以上存在しており、この時代には単語の間にスペースが導入されていませんでした。 なぜ今それを紹介するのでしょうか?

3. 中国語のテキストは単語の間にスペースがない方が美しく見えます。 スペースを導入すれば、中国語学習者にとっては理解しやすくなりますが、中国語を学習したばかりの学習者の便宜のために言語体系を適​​応させる人は誰もいません。

追伸 1.古代ヨーロッパの文書にも単語の間にスペースはありませんでした。

追伸 2:ロシア語ではスペースが必要です。スペースがないとステートメントの意味が変わってしまうからです。
比較してください: 不条理なものと異なるものを運ぶ。

追伸 3.:ロシア語の文章も、スペースなしで書かれていれば、ネイティブスピーカーには完全に理解されます。最初は理解するのが難しいですが、その後、私たちの脳は適応します...

句読点はどの言語にも不可欠な部分です。 普通のコンマは文の意味を根本的に変える可能性があります。「死刑執行は赦されない」という話を思い出してください。 また、翻訳者や編集者の仕事では、少なくとも 2 つの句読点を流暢に扱えることが求められます。

この投稿のアイデアは、記事の翻訳について話し合っていたときに生まれました。 原文では、パーセント記号と数字がスペースで区切られており、これが私の目に留まりました。この場合、ロシア語のテキストではスペースが使用されていません(ただし、この記述は依然として物議を醸しています。専門家はまだ結論を出していません)この問題に関してはコンセンサスがあります)。 それから私たちはそれについて話し合う必要があると判断しました。 多言語ローカリゼーション部門のスペシャリストが外国人の同僚にインタビューし、資料を作成しましたので、ここで共有します。 ぜひお役立てください。

最初と最後に
文中の句読点 (ピリオド、コンマ、コロン、セミコロン、疑問符、感嘆符) の配置がどうなるかを見てみましょう。

皆さんもロシア語について覚えておいてください。文を互いに区切る句読点は最後のピリオドにのみ置かれます。 表現を追加する必要がある場合(特に個人的な通信の場合)、「!!!」、「?!」などの文字の組み合わせが使用されます。 等 英語、ドイツ語、イタリア語、フランス系カナダ語、アラビア語、ブラジル系ポルトガル語では、点、楕円、およびその「同志」は同じ規則に従います。

フランス語のその他のルール: コロン、セミコロン、感嘆符、疑問符の前には非改行スペースが続きます。

スペイン語は、私たちが選択した言語の中で句読点が文章を構成する唯一の言語です。フレーズの先頭では、疑問符と感嘆符が「わずかに」反転した形、つまり「¿」と「¡」で重複します。

ヨーロッパの観点から見ると、中国人は句読点に対して最も珍しいアプローチをとっています。 ピリオドは「。」、カンマは「,」、感嘆符は「!」、疑問符は「?」のようになります。 文の中で、彼らはロシア語と同じように動作します。唯一の違いは、中国語はすべての句読点文字が 2 バイトであるため、スペースを使用しないことです。 キーボードでタイプされた象形文字は、ラテンアルファベットの文字の 2 倍の幅があります。 したがって、句読点は通常、象形文字と同じスペースを占めます。 この機能は、DOS を実行している古い IME で作業していた人が、間違って入力した象形文字が Backspace キーを 2 回押すと削除されるときに遭遇しました。 スペースは主に、英語などの他の言語と単語や文字を区切るために使用されます。

かわいい特徴
ロシア語ではハイフンまたはダッシュが使用されます。 ハイフンは短く、複合語を転送して接続するために必要です。 ダッシュはかなり長くなります。 これは、異なる文、1 つの文の 2 つの部分、対話などの意味部分を分離するのに役立ちます。 ロシア語の教科書を見れば、これらの記号の使用の微妙な点をすべて思い出すことができます。

ハイフンとダッシュは、英語、ドイツ語、フランス語、ブラジル系ポルトガル語でも同様の条件で存在します。 さらに、アメリカ英語ではダッシュの両側がスペースで区切られますが、イギリス英語では通常そうではありません。

今月このテーマに関する 3 回目となるこの講演には、さまざまな国からの講演者が参加します。 (アメリカ英語)

動物園には、ライオン、ヒョウ、トラ、ジャガー、チーターなど、たくさんの猫がいて、お気に入りを選ぶのは非常に困難でした。 (イギリス英語)


スペイン語、イタリア語、アラビア語では、ハイフンとダッシュは同じ「-」に見えます。 中国人はハイフンをまったく使用せず、ダッシュのみを使用します。 ただし、ラテン語のアルファベットの文字の隣には、ハイフン、長いダッシュ、および中ダッシュがある場合があります。 ハイフンは短く、複合語を転送して接続するために必要です。 ダッシュはかなり長くなります。 意味部分を分離するのに役立ちます
言語 ハイフン Em ダッシュ (Alt 0151)
ロシア
英語 アメリカ人 はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。
英語
イギリス人
はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。 両側がスペースで区切られていません。
ドイツ人 はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。
フランス語 はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。
フランス系カナダ人 はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。
スペイン語 はい、すべての場合において -
ポルトガル語
ブラジル人
はい、ハイフネーションと複合語の結合用 はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、対話など。
イタリアの はい、すべての場合において -
アラブ はい、すべての場合において -
中国語 ラテンアルファベットの文字の隣にのみ はい、すべての場合において
ペアになっている文字の種類

引用符はすべての言語に存在しますが、民族衣装と同様に、見た目が異なります。 ロシア語には、フランス語から来た伝統的な「クリスマスツリー」とドイツ語の「足」があり、これらは引用符内のフレーズや手書きで使用されます。 スペイン語、ブラジル系ポルトガル語、イタリア語、アラビア語では二重引用符が使用されます。

英語では「一重」引用符と「二重」引用符が使用されます。最初の引用符は見出しに使用され、2 番目の引用符は引用符に使用されます。 ピリオドとカンマは引用符で囲みます。 フランス語のテキストには「ヘリンボーン」がありますが、ロシア語との違いが 1 つあります。それは、引用されたテキストの先頭と開き引用符の間、およびフレーズの終わりと閉じ引用符の間に連続したスペースがあることです。

中国語には 3 種類の引用符があり、それぞれ異なる目的を果たします。 これらは、本、映画、その他の著作物の名前です。 それ以外の場合はすべて、中国人は「 such 」を使います。 ヨーロッパの伝統に由来する引用符 (「クリスマス ツリー」、「足」、「シングル」、「ダブル」のいずれであっても) は、翻訳の中で、またはヨーロッパ言語のフレーズと組み合わせてのみ使用できます。 繁体字中国語では人気がありません。

引用符はすべての言語に存在しますが、民族衣装と同様に、見た目が異なります。

言語 «…» „…“ “…” ‘…’ 《…》 「…」
ロシア 標準、ピリオドとカンマの外側 引用符内の句内および手書きの場合の代替語 手書きの場合の代替案 - - -
英語
アメリカ人
- - 見出しの標準 - -
英語
イギリス人
- - 引用時の標準、ピリオドとコンマの内側 見出しの標準 - -
ドイツ人 - 標準 - - - -
フランス語 引用符の開閉前の標準的な非改行スペース - - - - -
スペイン語 - - 標準 - - -
ポルトガル語
ブラジル人
- - 標準 - - -
イタリアの - - 標準 - - -
アラブ - - 標準 - - -
中国語 翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ 翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ 翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ 本、映画、その他の著作物のタイトルの標準 その他の場合の標準
象徴性
パーセントやppmも特に標準ではありません。 ドイツ語、フランス語、スペイン語では、これらの文字は非改行スペースで区切る必要があります。 また、ロシア語、英語、イタリア語、アラビア語、ブラジル系ポルトガル語では、数字の直後に書きます。 しかし、私たちが覚えているように、ロシア人の場合、状況は曖昧です。

度とインチは通常、数値の後にスペースを入れずに配置されます。

興味深い事実: フランス人は大きな数字を書くとき、3 桁のブロックをスペースで区切ります (例: 987,654,321.12)。

中国語には、度 (度) とパーセンテージ (百分比、百分之) を表す独自の文字があります。 ただし、通常の ° と % は、前にスペースを入れずに一緒に使用されます。

対話の確立
ダイアログの形式も言語によって異なります。 ロシア語では、各行の前に全角ダッシュを置きます。 ブラジル系ポルトガル語を話す人も同様です。

英語では、次のように「二重引用符」と「一重引用符」が使用されます。

「これは100万ポンドです」マリーナはサイモンにスーツケースを渡しながら言いました。

マリーナは続けて、「イワンと話したところ、『サイモンは1千万を要求しているが、それは多すぎる』と言いました。」


ドイツ語では、対話も伝統的な引用符「足」を使用してフォーマットされます。 フランス人は、行の作者が変わる場合に、短いダッシュだけでなく「ヘリンボーン」も入れます。 スペイン語でも会話の一部がダッシュで区切られています。

イタリア語とアラビア語では、会話に二重引用符を使用します。

中国人は通常、会話の中で「引用符」またはそれに相当する英語のみを使用します。

大なり小なり

英語、フランス語、スペイン語、ポルトガル語、ブラジル語、イタリア語では、ロシア語話者にとってはすべてがシンプルで馴染みがあり、略語や固有名詞には文頭で大文字が使用されます。

ドイツ語はもっと楽しいです。 名詞、名前、タイトル、住所の丁寧形 (Sie) はすべて大文字で書かれます (Ihr、Ihre、Ihrer、Ihres、Ihrem、Ihren)。 定冠詞 (das Gute) または不定冠詞 (ein Lächeln)、前置詞 (Blau)、代名詞 (dein Stotton)、数字 (nichts Aufregendes) または形容詞と組み合わせて名詞として文中で使用される形容詞、分詞、不定詞。活用形 (lautes Sprechen)。 まさにすべて:-)

アラビア語のアルファベットには小文字と大文字の区別はありませんが、ほとんどの文字には 2 つ、3 つ、または 4 つの異なるスペルがあり、単語の先頭、中間、末尾に使用され、場合によっては単語の外側の 1 文字に使用されます。 同様の状況が中国語でも発生しています。小文字と大文字を区別できる可能性は低いです。 また、中国人の著者がテキストの一部を強調する必要がある場合、下線を引くか太字を使用します。

ボーナス
面白いことに、私たちがインタビューしたヨーロッパ言語の話者の多くが、英語に存在するのと同じルールに従って大文字を使用しているが、それほど多くは使用していないことに注目しました。 インタビューを受けた同僚の一人は、次のように述べています。
私たちはあまり大文字にしないように努めています。

それは何を意味するのでしょうか? ;-)
トピックの続き:
タトゥーを入れる場所

SKB Kontur 社が 5 回目を開催する Kontur.Olympiad 2016 の結果がまとめられました。 オリンピックはどうなるのでしょうか? 第 1 ラウンド – 資格を獲得した生徒...