用PHP的FFI调用cjieba

phpjieba_ffi

使用PHP 7.4的 FFI 测试直接调用cjieba分词的动态库

选用CJieba的原因是FFI使用的是C的调用约定,如果用Cpp,还得自己包装一下,然后extern C,让编译器生成标准C的动态库。

碰到的问题

段错误

C变量没有初始化

直接调用了C的函数,没有通过FFI 初始化后的的C对象调用

非空判断 需要使用 FFI::isNull($x)

指针形式的数组 不能用foreach

指针形式数组的循环

查看C代码发现Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

返回的是一个结构体指针,在C语言里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操作来遍历,在FFI里面呢?

对于这个数组,我一开始用foreach 循环,直接报段错误了,后来和C一样,直接用指针++,发现是可行的,这里给FFI点赞,居然也可以直接操作C指针。

分词结果获取

如上面的代码,对于单个分词CJiebaWord,也不是保存的分词,而是sentence + offset,就是说第一个分词结果肯定是原始字符串。

在C的demo里是printf格式化(. 表示字段宽度和对齐),但是PHP里没有类似的方法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {
    printf("%*.*s\\n", x->len, x->len, x->word);
  }

用法示例

编译动态库

make libjieba.so

运行

time php demo.php

运行c demo

make demo
time ./demo

结果

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%

可以发现使用FFI,PHP的速度基本和C差不多,如有CPU占用大的业务,可以尝试使用其它语言(C/C++,golang,Rust等)编写然后导出标准C的动态库。

FFI的用途

在没有FFI之前,需要系统调用或者sdk方式调用的地方,PHP就需要开发扩展,但是开发扩展不仅需要理解C语言,还得了解PHP内核,比较困难。 现在就方便多了,直接使用FFI调用动态库即可。

扩展 宏展开

比如海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

关于用PHP的FFI调用cjieba的文章就分享到这,如果对你有帮助欢迎继续关注我们哦

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/41786.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
php学习php学习订阅用户
上一篇 2022年6月23日
下一篇 2022年6月23日

相关推荐

  • PHP微信开发:如何实现客服聊天窗口管理

    微信是目前全球用户规模最大的社交平台之一,随着移动互联网的普及,越来越多的企业开始意识到微信营销的重要性。在进行微信营销时,客服服务是至关重要的一环。为了更好地管理客服聊天窗口,我们可以借助PHP语言进…

    2023年5月18日
    01
  • PHP入门指南:PHP和XML。

    PHP是一种流行的Web编程语言,已经被广泛应用于互联网和企业应用。PHP可以动态生成Web页面,提供功能强大的数据处理和交互。而XML是一种可扩展的标记语言,可以用来描绘复杂的数据结构和关系,是数据交换和存储的重…

    2023年5月30日
    00
  • PHP函数的内部作用域和外部作用域。

    PHP函数的内部作用域和外部作用域在使用PHP编程语言时,函数是我们常用的一个工具。 函数允许我们将一段重复使用的代码打包成一个可重用的模块,使得代码的可读性和可维护性大大提高。 但是,当我们在函数内部定义…

    2023年5月28日
    01
  • PHP绘图的基本步骤

    (1)    先开启php的gd扩展,该扩展里面提供了很多绘图函数 打开php.ini配置文件 重启apache服务器 写一个phpinfo函数,测试一下     (2)    开始绘制图像 1.   先在内存中,创建图像资源(理解成画布):imagec…

    2018年8月31日
    0326
  • PHP入门指南:循环语句。

    PHP是一种广泛使用的编程语言,用于Web开发及其他许多领域。掌握PHP中的循环语句是成为优秀开发者的关键之一。在本文中,我们将讨论PHP的循环语句,包括for循环语句、while循环语句、和do-while循环语句。for循环语…

    2023年5月22日
    05
  • 如何使用PHP进行多语言框架开发?

    随着全球化的深入发展,越来越多的网站和应用程序需要支持多种语言。而PHP作为一种广泛应用于Web开发的编程语言,也需要支持多语言框架的开发。本文将介绍如何使用PHP进行多语言框架开发。一、什么是多语言框架首先…

    2023年5月17日
    00
  • 详细介绍php 三种文件下载的实现

    本篇文章给大家详细介绍php 三种文件下载的实现有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。1、直接添加文件链接<button> <a href = "http://localhost/down.zip"> 下…

    2023年3月29日 PHP自学教程
    01
  • (实用篇)php精确的统计在线人数的方法

    这是一个非常精确的,通过php实现统计在线人数的方法,想知道怎么实现的请耐心阅读。 <?php $filename='online.txt';//数据文件 $cookiename='VGOTCN_OnLineCount';//cookie名称 $onlinetime=600;//在线有效时间…

    2016年10月25日
    0232

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息