JNI学习笔记(四)——基础类型、Strings和数组

来源:互联网 发布:php实现网站tag标签 编辑:程序博客网 时间:2024/06/05 23:08

由于java编程语言和C、C++的数据类型不一致,所以在JNI和native代码直接数据类型的映射就成了问题。这里将学习java编程语言和native代码之间的类型如何转换。



一个简单的native方法


我们在java中实现这样一个类,保存为Prompt.java:

class Prompt {public static void main(String[] args) {Prompt p = new Prompt();String input = p.getLine("Type a line: ");System.out.println("User typed: " + input);}static {System.loadLibrary("Prompt");}/* native method that prints a prompt and reads a line */public native String getLine(String prompt);}

回顾一下上节中讲的使用JNI的步骤:

首先用javac Prompt.java生成Prompt.class,然后用javah -jni Prompt自动生成Prompt.h。在头文件Prompt.h中我们将看到:

/* DO NOT EDIT THIS FILE - it is machine generated */#include <jni.h>/* Header for class Prompt */#ifndef _Included_Prompt#define _Included_Prompt#ifdef __cplusplusextern "C" {#endif/* * Class:     Prompt * Method:    getLine * Signature: (Ljava/lang/String;)Ljava/lang/String; */JNIEXPORT jstring JNICALL Java_Prompt_getLine  (JNIEnv *, jobject, jstring);#ifdef __cplusplus}#endif#endif


在上一节中我们讲过,JNIEXPORT宏和JNICALL的功能:

它们保证了该方法从native库中被导出,并且以正确的调用方式生成该函数(其实主要是指参数入栈方式)。

不知大家注意到了signature没有,

(Ljava/lang/String;)Ljava/lang/String;
它指示了native方法的参数和返回值类型:(Ljava/lang/String;)表示该方法在java语言中的的参数是String。括号后的Ljava/lang/String表示该方法在java语言中的返回值是String

根据我们在上一节中讲的,几遍没有java代码,我们也可以从这个头文件中看出:这个native方法在java中的定义:

class Prompt {xxx native String getLine(String);}


native方法的参数

如上所述,可以发现每个native方法在从java转成C、C++格式的方法时,会增加额外的两个参数:

1)第一个参数JNIEnv *:它指向一个包含了函数表的指针的地址,每个指针都指向了一个JNI函数。native方法经常通过JNI方法来访问一个在java VM中的数据结构。下图是JNIEnv接口指针:


2)第二个参数,根据native方法是一个static方法还是一个实例方法而不同的。如果是一个实例方法,它就是调用该方法的对象的引用,和C++中的this指针类似(此时类型为jobject)。如果是一个static方法,那它就对应着包含该方法的类(此时类型为jclass)。在本例中,Java_Prompt_getLine方法,是一个实例方法,所以这个参数是对象的自己的引用。



类型映射


在native方法声明(java中的声明)中的参数类型,在native编程语言中有着对应的类型。JNI定义了一组和java编程语言对应的C、C++类型。

大家知道,在java编程语言中有两种类型:基础类型(例如:int, float, char...)以及引用类型(例如:类、实例、数组)。在java编程语言中,字符串是java.lang.String类的实例。

JNI对待基础类型和引用类型是不同的。基础类型的映射是简单、直接的。例如java语言中的int映射到C、C++的jint(定义在jni.h中,是一个有符号的32为整数),而java中的float对应于C++的jfloat(定义在jni.h中,是一个32为浮点型),下表是JNI和java的类型对应:
java语言类型native类型描述说明booleanjbooleanunsigned 8 bitsbytejbytesigned 8 bitscharjcharunsigned 16 bitsshortjshortsigned 16 bitsintjintsigned 32 bitslongjlongsigned 64 bitsfloatjfloat32bitsdoublejdouble64 bits
此外还有一个jsize整型,被用来描述主要的索引和大小typedef jint jsize。

JNI把对象作为透明的引用传递给native方法。不透明的引用是和java VM中和内部数据结构相关的C的指针类型。而内部数据结构真正的布局,对于开发人员来说是不可见的,被隐藏的。native代码必须通过合适的JNI函数才能操控下面的对象,这些JNI函数可以通过JNIEnv接口指针来访问。例如在JNI中对应于java.lang.String的类型是jstring。而jstring引用的确切的值和native代码是不相干的。native代码调用JNI方法(例如GetStringUTFChars())来访问一个字符串的内容。


所有的JNI引用都有jobject类型。为了便捷和类型安全,JNI定义了一组引用类型,它们从概念上讲,是jobject的子类型。(A是B的一个子类型,那么A的每个实例自然也是B的一个实例)。这些子类型相当于java语言中常用的引用类型。例如(jstring表示字符串,jobjectArray表示一个对象数组)。以下是JNI引用类型和它的子类型关系的完整列表:



在C语言中,所有的其它的引用类型都被定义为同样的对象。例如

typedef jobject jclass;

在C++中,JNI引入一组虚类,来表达各个引用类型之间的子类型关系:

class _jobject {};class _jclass : public _jobject {};class _jthrowable : public _jobject {};class _jstring : public _jobject {};class _jarray : public _jobject {};class _jbooleanArray : public _jarray {};class _jbyteArray : public _jarray {};class _jcharArray : public _jarray {};class _jshortArray : public _jarray {};class _jintArray : public _jarray {};class _jlongArray : public _jarray {};class _jfloatArray : public _jarray {};class _jdoubleArray : public _jarray {};class _jobjectArray : public _jarray {};typedef _jobject *jobject;typedef _jclass *jclass;typedef _jthrowable *jthrowable;typedef _jstring *jstring;typedef _jarray *jarray;typedef _jbooleanArray *jbooleanArray;typedef _jbyteArray *jbyteArray;typedef _jcharArray *jcharArray;typedef _jshortArray *jshortArray;typedef _jintArray *jintArray;typedef _jlongArray *jlongArray;typedef _jfloatArray *jfloatArray;typedef _jdoubleArray *jdoubleArray;typedef _jobjectArray *jobjectArray;



访问字符串


如上所说的,对于引用类型,native代码并不能直接访问,jstring表示java VM中字符串,并且和普通的C字符串是不一样的,在native代码中不能像使用普通C字符串一样使用它们。如下代码,不但达不到预期的效果,而且还有可能导致java VM当机。
JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *penv, jobject obj, jstring strPrompt){/*error: incorrect use of jstring as a char* pointer */printf("%s", strPrompt);...}


转换到native字符串


由于上诉原因,在native方法的代码中,必须使用一个合适的JNI接口函数将jstring对象转换C、C++字符串。JNI支持从Unicode和向Unicode转换,同时也支持从UTF-8和向UTF-8转换。Unicode字符串用16bit值表示一个字符,而UTF-8用一个编码方案,它向上兼容7-bit的ASCII字符串。UTF-8像一个NULL结尾的C字符串,即便它们包含了非ASCII字符。所有7-bit的ASCII字符的值在1~127之间,而在UTF-8中也是这些值。一个字节的最高位被设置了,标志了多字节编码的16-bit Unicode值的开始。

Java_Prompt_getLine函数调用JNI函数GetStringUTFChars()来读取字符串的内容。它将jstring 引用(在java VM 中,一般是Unicode序列)转换为C字符串(一般以UTF-8格式代表)。如果能够确定原始字符串只包含7-bit的ASCII字符,你可以将转换后的字符串传给普通的C库的函数,例如printf。(在后面的章节,我们将介绍如何处理非ASCII字符串)。下面是Java_Prompt_getLine的实现(C++):
JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *penv, jobject obj, jstring strPrompt){    char buf[128];    const jbyte *str;    str = penv->GetStringUTFChars(prompt, NULL);    if (str == NULL) {        return NULL; /* OutOfMemoryError already thrown */    }    printf("%s", str);    penv->ReleaseStringUTFChars(prompt, str);    /* We assume here that the user does not type more than     * 127 characters */    scanf("%s", buf);    return penv->NewStringUTF(buf);}


GetStringUTFChars()函数的返回值是指针,需要被检查。这是因为为保存UTF-8字符串,java VM需要分配内存资源,这样就有可能分配失败。当失败时GetStringUTFChars()返回NULL,并且抛出一个OutOfMemoryError异常。(在后面的章节中,我们会提到,JNI的异常抛出和java语言中的异常抛出是不一样的)。通过JNI抛出的关起异常,不会自动改变native C代码的控制流程。而是,我们需要一个显示的return语句,来避免该函数中程序继续运行。在Java_Prompt_getLine返回之后,这个异常会被抛送到Prompt.main——native方法:Prompt.getLine的调用者。


释放native字符串资源


当你的native代码完成了使用通过GetStringUTFChars()获得的UTF-8字符串,它调用ReleaseStringUTFChars()。调用ReleaseStringUTFChars(),意味着native方法不再使用该UTF-8字符串,这样被该UTF-8字符串占用的内存就可以被释放了。调用ReleaseStringUTFChars()失败,会导致一个内存泄露,并最重导致内存衰竭。


构造新的字符串


可以在native方法里,通过调用JNI函数:NewStringUTF,构造一个新的java.lang.String实例。这个函数利用一个UTF-8格式的C字符串来构造一个java.lang.String实例。新构造的java.lang.String实例,它是一个Unicode字符串序列,该序列和给定的UTF-8格式的C字符串一致。

如果java VM不能够为新的java.lang.String实例分配内存,NewStrigUTF抛出OutOfMemoryError异常,并且返回NULL,并且该异常会被抛送到Prompt.main方法中(native方法的调用者)。


其他JNI字符串函数


JNI在GetStringUTFChars、ReleaseStringUTFChars、NewStringUTF函数之外,还支持许多其他字符串相关的函数。

GetStringChars、ReleaseStringChars获取Unicode格式的字符串,当系统支持Unicode的时候,这个些函数非常有用。


UTF-8字符串,通常以‘\0’字符结尾,而Unicode字符串却不是。为了获得一个jstring引用中的Unicode字符的个数,JNI开发人员可以调用JNI函数GetStringLength。为了得知需要多少字节来保持一个UTF-8格式的jstring,开发人员可以在GetStringUTFChars的返回中调用strlen, 或者直接调用JNI函数GetStringUTFLength。


注意:

不管如何,当不再继续使用通过GetStringChars、GetStringUTFChars获取到的字符串时,需要调用ReleaseStringChars、ReleaseStringUTFChars来释放分配的内存资源。



Java2 JDK1.2中新的JNI字符串函数


为了增加java VM返回直接指向java.lang.String实例中的字符的指针的可能性,java2 JDK1.2引入了一对新的函数:GetStringCritical、ReleaseStringCritical。表面上它和GetStringChars、ReleaseStringChars相似(如果可能,它们都返回指向字符的指针,否则都是一个副本),然而,如何使用这对函数有很大的限制。

必须把在这对函数之间的代码当中临界区。在一个临界区中,native代码必须不能任意的调用JNI函数,或者或者不能调用任何一个可能会导致当前线程被阻塞,并且等待在java VM中的其它线程运行的native函数。例如,当前线程必须不能等待一个输入的I/O流(该流由其它线程写入)。

这些严格的限制使VM在native代码持有一个通过GetStringCritica函数获取到的直接执行字符串元素的指针时停止垃圾回收。当垃圾回收不被允许时,任何其它触发垃圾回收的线程都会被阻塞。所以在GetStringCritical和ReleaseStringCritical之间的native代码,必须不能引起阻塞调用,或者在java VM中分配一个新的对象,否则,VM可能会死锁。

当GetStringCritical和ReleaseStringCritical重复成对出现,是安全的,以下代码:
jchar *s1, *s2;s1 = (*env)->GetStringCritical(env, jstr1);if (s1 == NULL) {    ... /* error handling */}s2 = (*env)->GetStringCritical(env, jstr2);if (s2 == NULL) {    (*env)->ReleaseStringCritical(env, jstr1, s1);    ... /* error handling */}...     /* use s1 and s2 */(*env)->ReleaseStringCritical(env, jstr1, s1);(*env)->ReleaseStringCritical(env, jstr2, s2);
在GetStringCritical和ReleaseStringcritical之间不允许其它JNI函数调用,唯一可以在其中调用的JNI函数是它们自己。


另外增加的JNI函数是:GetStringRegion和GetStringUTFRegion,它们将字符串元素复制到一个预先分配好了的缓冲中。所以,Prompt.getLine方法也可以这样实现:

JNIEXPORT jstring JNICALLJava_Prompt_getLine(JNIEnv *env, jobject obj, jstring prompt){/* assume the prompt string and user input has less than 128       characters */    char outbuf[128], inbuf[128];    int len = (*env)->GetStringLength(env, prompt);    (*env)->GetStringUTFRegion(env, prompt, 0, len, outbuf);    printf("%s", outbuf);    scanf("%s", inbuf);    return (*env)->NewStringUTF(env, inbuf);}

GetStringUTFRegion哈市需要一个开始索引和长度,它们都以Unicode字符计。这个方式,在某些程度上比GetStringUTFChars简单,因为GteStringUTFRegion没有内存分配,我们不需要检查out-of-memory条件。



JNI字符串函数的汇总


JNI函数描述起始GetStringChars
ReleaseStringChars获取或释放一个指向Unicode格式字符串内容的指针。
可能返回该字符串的副本。JDK1.1GetStringUTFChars
ReleaseStringUTFChars获取或释放一个指向UTF-8格式字符串内容的指针。
可能返回该字符串的副本。JDK1.1GetStringLength返回字符串中Unicode字符的格式JDK1.1GetStringUTFLength返回保持一个UTF-8格式的字符串所需要的字节数JDK1.1NewString创建一个java.lang.String实例,它包含和给定Unicode C字符串相同的字符序列JDK1.1NewStringUTF创建一个java.lang.String实例,它包含和给定UTF-8 C字符串相同的字符序列JDK1.1GetStringCritical
ReleaseStringCritical获取一个指向Unicode格式字符串内容的指针。可能返回一个字符串的副本。
native代码在Get/ReleaeStringCritical调用之间必须不能阻塞。Java2
JDK1.2GetStringRegion
setStringRegion将一个字符串的内容拷贝至或者到一个预先分配好了的C缓冲区中。(以Unicode格式)Java2
JDK1.2GetStringUTFRegion
setStringUTFRegion将一个字符串的内容拷贝至或者到一个预先分配好了的C缓冲区中。(以UTF-8格式)Java2
JDK1.2


在JNI字符串函数中选择一个合适的函数

既然有这么多函数可以选择,那么应该选择哪些函数来访问字符串呢?且依照下图所示:




访问数组


JNI对待基础类型数组和对象数组是不同的。例如在java语言中:

int[] iarr;float[] farr;Object[] oarr;int[][] arr2;
iarr和farr是基础数组,而oarr和arr2确实对象数组。


在一个native方法中访问基础数组,要求使用那些和访问字符串的函数类似的JNI函数。例如下例:

class IntArray {    private native int sumArray(int[] arr);    public static void main(String[] args) {        IntArray p = new IntArray();        int arr[] = new int[10];        for (int i = 0; i < 10; i++) {            arr[i] = i;        }        int sum = p.sumArray(arr);        System.out.println("sum = " + sum);    }    static {        System.loadLibrary("IntArray");    }}


在native语言(C、C++)中访问数组


在JNI中,数组被jarrary引用类型以及它的子类型(如jintArray)表示。就如jstring不是一个C的字符串类型一样,jarray同样也不是一个C的数组类型。jarrary在Java_IntArray_sumArray native 方法的实现中,也不能直接访问jarray引用。如下代码,是非法的:
/* This program is illegal! */JNIEXPORT jint JNICALLJava_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr){    int i, sum = 0;    for (i = 0; i < 10; i++) {        sum += arr[i];    }}

为了正确访问,必须选择一个合适的JNI函数来访问基础数组的元素,例如以下方案:

JNIEXPORT jint JNICALLJava_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr){    jint buf[10];    jint i, sum = 0;    (*env)->GetIntArrayRegion(env, arr, 0, 10, buf);    for (i = 0; i < 10; i++) {        sum += buf[i];    }    return sum;}


访问基础类型的数组


上一例中使用了GetIntArrayRegion函数来访问整型数组,并且把它的所有元素复制到一个C缓冲区中。第三个参数0,是指起始索引,第四个参数10是指需要被复制的元素的个数。只要这些元素被复制到了C缓冲区,就可以在native代码中直接访问它们了。

JNI支持一个对应的函数来运行native代码修改该数组中的元素(setIntArrayRegion)。其它基础类型的数组也同样支持该功能。

JNI支持Get<Type>ArraryElements,Release<Type>ArrayElement家族,它们运行native代码获取一个直接指向基础类型数组元素的指针。由于垃圾回收可能不支持寄存,所有VM可能返指向原数组副本的指针。这样,我们可以重写Java_IntArray_sumArray方法:
JNIEXPORT jint JNICALLJava_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr){    jint *carr;    jint i, sum = 0;    carr = (*env)->GetIntArrayElements(env, arr, NULL);    if (carr == NULL) {        return 0; /* exception occurred */    }    for (i=0; i<10; i++) {        sum += carr[i];    }    (*env)->ReleaseIntArrayElements(env, arr, carr, 0);    return sum;}

GetArrayLength函数返回基础数组或者对象数组中元素的个数。这个固定的长度,是在该数组被第一次分配的时候所决定的。

和字符串的函数一样,java 2 JDK1.2引入了GetPrimitiveArrayCritical和ReleasePrimitiveArrayCritical函数。它们的用户和GetStringCritical、RelaseStringCritical方法一样。


JNI基础数组函数的汇总

JNI函数描述起始Get<Type>ArrayRegion
Set<Type>ArrayRegion复制基础数组的内容到预先分配 好了的C缓冲区,
或者从C缓冲区复制内容到基础数组。JDK1.1Get<Type>ArrayElements
Release<Type>ArrayElements获取一个指向基础数组内容的指针,
该指针指向的可能是原数组的一个副本。JDK1.1GetArrayLength返回数组元素的个数JDK1.1New<Type>Array创建一个给定长度的数组JDK1.1GetPrimitiveArrayCritical
ReleasePrimitiveArratCritical获取或者释放一个指向基础数组内容的指针,
该指针可能指向基础数组的一个副本。JDK1.2

在各个JNI基础数组函数中选择一个合适的函数





访问对象数组


JNI提供了一对单独的函数来访问对象数组:GetObjectArrayElement返回一个位于给定索引的元素,而SetObjectArrayElement则是更新给定索引上的元素。和基础类型数组不一样的是,你不能一次获取所有的对象元素,或者一次复制多个对象元素。

Strings和数组都是引用类型。你可以使用上述两个函数来访问字符串的数组和数组的数组。如下面例子,创建了一个二维数组,并且打印其中的内容:
class ObjectArrayTest {    private static native int[][] initInt2DArray(int size);    public static void main(String[] args) {        int[][] i2arr = initInt2DArray(3);        for (int i = 0; i < 3; i++) {            for (int j = 0; j < 3; j++) {                 System.out.print(" " + i2arr[i][j]);            }            System.out.println();        }    }    static {        System.loadLibrary("ObjectArrayTest");    }}

静态native方法initIntDArray创建一个给定大小的二维数组,该方法,分配并且初始化该二维数组:
JNIEXPORT jobjectArray JNICALLJava_ObjectArrayTest_initInt2DArray(JNIEnv *env,                                   jclass cls,                                   int size){    jobjectArray result;    int i;    jclass intArrCls = (*env)->FindClass(env, "[I");    if (intArrCls == NULL) {        return NULL; /* exception thrown */    }    result = (*env)->NewObjectArray(env, size, intArrCls,NULL);    if (result == NULL) {        return NULL; /* out of memory error thrown */    }    for (i = 0; i < size; i++) {        jint tmp[256];  /* make sure it is large enough! */        int j;        jintArray iarr = (*env)->NewIntArray(env, size);        if (iarr == NULL) {            return NULL; /* out of memory error thrown */        }        for (j = 0; j < size; j++) {            tmp[j] = i + j;        }        (*env)->SetIntArrayRegion(env, iarr, 0, size, tmp);        (*env)->SetObjectArrayElement(env, result, i, iarr);        (*env)->DeleteLocalRef(env, iarr);    }    return result;}

其中调用JNI函数:FindClass来获得一个二维int数组的元素的类的引用。“[I”参数是JNI累的描述符,它对应着java语言中的int[ ]类型。FindClass在加载失败时,会返回NULL,并且抛出一个异常。


NewObjectArray分配了一个数组,它的元素的类型由iniArrCls引用表示。到此,NewObjectArray只是分配了第一维,我们需要填满它的第二维。java VM对于多为数组,没有特定的数据结构。一个二维的数组,其实就是一个数组的数组(以此类推)。


创建第二维的代码非常直接、简单。函数分配独立的数组元素,并用SetIntArrayRegion复制tmp[ ]临时缓冲区的内容到新分配的一维数组中。这之后,数组i行j列的的元素的值被设置为i+j。于是将输出:
 0 1 2
 1 2 3
 2 3 4


DeleteLocalRef在循环的最后被调用,这保证了VM不会耗尽内存(用来保持JNI引用,例如iarr)。在以后的章节中会解释它。