PHP函数如何增加强制类型返回实例

在开发过程中,函数的返回值类型应该是确定不变的,但PHP是弱类型的语言,

所以PHP是没有此类语法验证的,正因为如此,造成了很多坑坑。

比如下面的代码:

<?php

function getArticles(...){

$arrData = array();

if($exp1){

return $arrData;

}else if($exp2){

return 1;

}else{

return false;

}

}

$arrData =getArticles(...);

foreach($arrData as $record){

//do something.

....

}

?>

函数getArticles根据不同的条件返回不同类型的值,有bool、int、还有数组,正常情况这类函数是希望返回数组,然后拿数组去做一些其他操作,

可因为函数返回值类型不固定,调用时就很可能产生各种预想不到的坑,

因此我就想,既然不能规范,那直接强制好了。

函数/方法返回值可以强制类型,如 图

支持四种强制类型限制:int、array、bool、object,当返回值与函数声明中的类型不匹配时,抛出warning,本来想抛出error,但是觉得

太狠了,只能算是个异常,不能算错误,所以就用warning好了。

PHP本身是不支持 int function 这样的语法的,所以要支持,就先要搞定语法解析器,关于语法解析器,可以移步这里>>>查看

详情,这里就不讲了,

先修改语法扫描 Zend/zend_language_scanner.l文件

增加如下代码:

<ST_IN_SCRIPTING>"int" {

return T_FUNCTION_RETURN_INT;

}

<ST_IN_SCRIPTING>"bool" {

return T_FUNCTION_RETURN_OBJECT;

}

<ST_IN_SCRIPTING>"object" {

return T_FUNCTION_RETURN_OBJECT;

}

<ST_IN_SCRIPTING>"resource" {

return T_FUNCTION_RETURN_RESOURCE;

}

意思很简单,扫描器扫描到到关键字 int、bool、object、resource、array时返回相应的T_FUNCTION_* ,这是一个token,

scanner根据不同的token做不同的处理,token要先在Zend/zend_language_parser.y文件中定义

增加如下代码

..........

%token T_FUNCTION_RETURN_INT

%token T_FUNCTION_RETURN_BOOL

%token T_FUNCTION_RETURN_STRING

%token T_FUNCTION_RETURN_OBJECT

%token T_FUNCTION_RETURN_RESOURCE

然后增加token处理逻辑:

function:

T_FUNCTION { $$.u.opline_num = CG(zend_lineno);$$.u.EA.var  = 0; }

|   T_FUNCTION_RETURN_INT T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_LONG;

}

|   T_FUNCTION_RETURN_BOOL T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_BOOL;

}

|   T_FUNCTION_RETURN_STRING T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_STRING;

}

|   T_FUNCTION_RETURN_OBJECT T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_OBJECT;

}

|   T_FUNCTION_RETURN_RESOURCE T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_RESOURCE;

}

|   T_ARRAY T_FUNCTION {

$$.u.opline_num = CG(zend_lineno);

$$.u.EA.var = IS_ARRAY;

}

$$.u.EA.var 存储的是 函数返回类型,最后要拿他来跟返回值类型做匹配,

这样语法解释器就可以处理我们新的php语法了。

这还不够,还需要修改函数声明定义的处理逻辑

Zend/zend_compile.c ::zend_do_begin_function_declaration

......

zend_op_array op_array;

char *name = function_name->u.constant.value.str.val;

int name_len = function_name->u.constant.value.str.len;

int function_type  = function_token->u.EA.var; //保存函数类型,在语法解释器中增加的: $$.u.EA.var = IS_LONG;

int function_begin_line = function_token->u.opline_num;

......

op_array.function_name = name;

op_array.fn_type = function_type; //将类型保存到op_array中,

op_array.return_reference = return_reference;

op_array.fn_flags |= fn_flags;

op_array.pass_rest_by_reference = 0;

..........

PHP是先解析PHP语法生成相应的opcode,将需要的环境、参数信息保存到execute_data全局变量中,最后在通过execute函数逐条执行opcode,

所以要做处理就要把函数的类型保存到opcode中:op_array.fn_type = function_type;

op_array是没有fn_type的,要修改op_array的结构,增加zend_uint fn_type;

(关于opcode你可以想象一下 从c转为汇编,我博客中也有相关文章,可以参考一下)

最后要修改opcode的毁掉函数,函数的返回 return 会生成token T_RETURN,T_RETURN会根据返回的类型调用不同的calback函数:

ZEND_RETURN_SPEC_CONST_HANDLER

ZEND_RETURN_SPEC_TMP_HANDLER

ZEND_RETURN_SPEC_VAR_HANDLER

它有三个callback,如果返回值是一个 const类型的数据,则 ZEND_RETURN_SPEC_CONST_HANDLER
返回值是临时数据,如 : return 1,则ZEND_RETURN_SPEC_TMP_HANDLER
返回值是一个变量,如 : return $a,则ZEND_RETURN_SPEC_VAR_HANDLER

所以要在这三个callback函数中增加处理逻辑:

在callback函数return之前增加如下代码

if((EG(active_op_array)->fn_type > 0) && Z_TYPE_P(retval_ptr) != EG(active_op_array)->fn_type){

php_error_docref0(NULL TSRMLS_DC,E_WARNING, "function name %s return a wrong type.", EG(active_op_array)->function_name );

}

fn_type 去跟 返回值的类型作比较,如果没有匹配到,就会抛出这个warning。

我已经打了补丁,目前只支持php5.3版本,有需要的可以拿去玩一玩。

不清楚为什么官方不支持此语法,我觉得还是挺有必要的。

下载补丁:php-syntax.patch

续:

后来有找鸟哥(惠新宸:http://weibo.com/laruence) 聊过,

下面是他的回答:

“这个话题, 基本也是邮件组的月经贴了…. 1. 因为PHP是若类型, 很多类型可以互相转换, 那么到底要不要隐式转换, 你的实现是不转换, 这样的局限太大, 如果转换又涉及到各种转换规则. 2. 也不是不支持, 不过你的这个实现肯定是不够的(各种自定类,和继承类). 3. 以后如果要做jit, 可能会考虑支持.”

如此看来,这个问题官方也是比较纠结的,确实是我的思路是不强制转换,只需要抛出警告就行了,让开发人员自己决定是否转换,是不是更好?

facebook的hack语言,也支持强制类型转换。不过改动太多的话,PHP升级维护是不是会比较差一些。。

时间: 2024-10-30 00:25:21

PHP函数如何增加强制类型返回实例的相关文章

isArray()函数(JavaScript中对象类型判断的几种方法)_javascript技巧

1) typeof 运算符 typeof 是一元运算符,返回结果是一个说明运算数类型的字符串.如:"number","string","boolean","object","function","undefined"(可用于判断变量是否存在). 但 typeof 的能力有限,其对于Date.RegExp类型返回的都是"object".如: typeof {}; //

c++-在写函数时 是不是要把返回值都放在形参表里?把函数返回值设定为true/false?

问题描述 在写函数时 是不是要把返回值都放在形参表里?把函数返回值设定为true/false? 在写函数时 是不是要把返回值都放在形参表里?把函数返回值设定为true/false? 解决方案 主要还是看程序需要把,这种想法只是对于一些内存申请操作来说,函数在结束后就将函数内申请的控件释放.如果已经在外部申请好了内存,是可以当做返回值返回的.所以说并不一定就要把返回值放在形参表里. 解决方案二: 这也是一种方式,尤其对于要返回多个结果的时候,一般通过参数来传递结果.然后函数返回值来表示函数是否调用

浅谈char*类型返回值和字符串常量_C 语言

看这样一段简单的程序: #include <stdio.h> char* fun() { return "fun"; } int main() { printf("%s", fun()); return 0; } 这段程序可以正常run,但是最好不要这么做. 因为  直观上你返回了一个局部的东西出去.  你可以再外面定义这个常量,然后返回. 另外,字符串常量不可修改,而char*意味着要修改,故此最好加上const. 以上就是小编为大家带来的浅谈char

mfc-MFC对话框透明代码,在初始化函数中增加的,哪里错了?

问题描述 MFC对话框透明代码,在初始化函数中增加的,哪里错了? SetWindowLong(this->GetSafeHwnd(),GWL_EXSTYLE,GetWindowLong(this->GetSafeHwnd(),GWL_EXSTYLE)^0x8000); HINSTANCE hInst = LoadLibrary(TEXT("User32.DLL")); if(hInst) { typedef BOOL (WINAPI* MYFUNC)(HWND,COLORR

struts-急求使用jquery提交的请求回调函数接收不到后台返回值解决办法

问题描述 急求使用jquery提交的请求回调函数接收不到后台返回值解决办法 $.ajax({ type: "post", url: uri, async:true, data: data, success: function (result) { $("#showrecord").append(result); }, error:function(XMLResponse){ alert("wait a minute"); } }); 后台: Ht

c-一个有关sort函数第三个参数返回值的疑问

问题描述 一个有关sort函数第三个参数返回值的疑问 #include #include #include using namespace std; const int maxsize = 1000; struct stu{ char name[100]; int age; int score; }; bool cmp(stu a,stu b) { if(a.score < b.score) return true; int temp = strcmp(a.name,b.name); if(te

link中函数除了能定义在类型里面,是否可以定义在函数里面?

问题描述 link中函数除了能定义在类型里面,是否可以定义在函数里面? link中函数除了能定义在类型里面,是否可以定义在函数里面? 解决方案 可使用匿名函数: Func<int int> 内嵌函数 = x => x * x;int j = 内嵌函数(10); // 100 解决方案二: 不能.只有类可以嵌套,函数不可以嵌套. 解决方案三: 可使用匿名函数:Func 内嵌函数 = x => x * x;int j = 内嵌函数(10); // 100

成本最低的Amazon EC2实例类型——T2实例

今年7月初,亚马逊公司(Amazon.com)旗下的Amazon Web Services宣布正式推出新型亚马逊EC2(Amazon EC2)实例类型--T2实例.这一实例最主要的功能在于能够大幅降低不需要持续高CPU性能,但能够从突发性的全核心中受益的应用的成本.T2按需实例初始定价为0.013美元/小时或9.5美元/月,这是亚马逊成本最低的Amazon EC2实例类型,也是Web服务器.开发人员环境和小型数据库的能够选择的最佳理想选择.若将T2和Amazon通用SSD弹性存储块(Elasti

php中url函数介绍及使用示例_php实例

base64_encode - 使用 MIME base64 对数据进行编码base64_encode() returns 使用 base64 对 data 进行编码.设计此种编码是为了使二进制数据可以通过非纯 8-bit 的传输层传输,例如电子邮件的主体.Base64-encoded 数据要比原始数据多占用 33% 左右的空间. 复制代码 代码如下: <?php$str = 'This is an encoded string';// VGhpcyBpcyBhbiBlbmNvZGVkIHN0c