文字列を指定文字で分割
はじめに
Stringのsplitメソッド
public String[] split( String regex, int limit )
・指定された正規表現で文字列を分割します。 パラメータ regex : 正規表現の区切り(区切り文字) limit : 最大分割数 指定しない場合は、無制限 0の場合は、無制限 戻り値 分割された文字列の配列
以下が、区切り文字での文字列を分割する例です。
例1)"A,B,C"を区切り文字','(半角のカンマ)で分割
A B C
半角のカンマで区切られた3つの文字列になります。
例2)"犬;猫;熊,パンダ;うさぎ"を区切り文字';'(半角のセミコロン)で分割
犬 猫 熊,パンダ うさぎ
半角のセミコロンで区切られた4つの文字列になります。
例3)"トマト,キュウリ,,キャベツ,ピーマン,"を区切り文字','(半角のカンマ)で分割
トマト キュウリ ← 空文字 キャベツ ピーマン ← 空文字
半角のカンマで区切られた6つの文字列になります。半角カンマが2つ連続している場合は、文字が無いとみなし空文字になります。また、最後の文字が半角カンマの場合も空文字になります。
例4)",車,電車,飛行機"を区切り文字','(半角のカンマ)で分割
← 空文字 車 電車 飛行機
例5)"晴れ 曇り 雨"を区切り文字' '(半角のスペース)で分割
晴れ 曇り 雨
半角のスペースで区切られた3つの文字列になります。半角のスペースは他の文字と同様に1つの文字とみなされます。よって、半角のスペースが2つ以上連続している場合は、空文字列になります。以下の例6)は、半角スペースが2つ連続している例です。
例6)"晴れ曇り 雨"を区切り文字' '(半角のスペース)で分割
晴れ ← 空文字 曇り 雨
Javaソースコード
StringSplit1.java
001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 021 022 023 024 025 026 027 028 029 030 031
public class StringSplit1 { public static void main( String[] args ) { // 分割元の文字列 String str; // 分割後の文字列を格納 String[] ans; // ','で分割 str = "A,B,C"; ans = str.split( "," ); // 結果の表示 System.out.println( "分割数: " + ans.length ); for ( int i = 0; i < ans.length; ++ i ) System.out.println( ans[ i ]); // 改行 System.out.println(); // ' '(半角スペース)で分割 // "晴れ"と"曇り"の間に半角スペースが2つ str = "晴れ 曇り 雨"; ans = str.split( " " ); // 結果の表示 System.out.println( "分割数: " + ans.length ); for ( int i = 0; i < ans.length; ++ i ) System.out.println( ans[ i ]); } }
コンパイル ソースコードが「ANSI」の場合
C:\talavax\javasample>javac -encoding sjis StringSplit1.java
コンパイル ソースコードが「UTF-8」の場合
C:\talavax\javasample>javac StringSplit1.java
実行
C:\talavax\javasample>java StringSplit1
実行結果
分割数: 3 A B C 分割数: 4 晴れ 曇り 雨
StringSplit2.java
001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017
public class StringSplit2 { public static void main( String[] args ) { // 分割元の文字列 String str = "A,B,C,D,E,F,G,H"; // 分割後の文字列を格納 String[] ans; // ','で分割(最大3分割) ans = str.split( ",", 3 ); // 結果の表示 System.out.println( "分割数: " + ans.length ); for ( int i = 0; i < ans.length; ++ i ) System.out.println( ans[ i ]); } }
コンパイル ソースコードが「ANSI」の場合
C:\talavax\javasample>javac -encoding sjis StringSplit2.java
コンパイル ソースコードが「UTF-8」の場合
C:\talavax\javasample>javac StringSplit2.java
実行
C:\talavax\javasample>java StringSplit2
実行結果
分割数: 3 A B C,D,E,F,G,H
分割する最大値を3にしているので、文字が3つに分割されています。最大数を指定しない場合は8つに分割されます。
以上です。