UnicodeDecodeError: 'utf-8' не может декодировать байт

Я написал простую программу сокета-клиента/сервера, где часть сервера находится на языке C, тогда как клиент находится на питоне. Я очень могу отправить данные от клиента на сервер, но не могу отправить ответное сообщение/данные обратно в скрипт python.

server.c

#include<stdio.h>
#include<sys/socket.h>
#include<arpa/inet.h> //inet_addr
#include<unistd.h>
#include<string.h>
#include<stdlib.h>
int main(int argc , char *argv[])
{
    int socket_desc , new_socket , c, valread;
    struct sockaddr_in server, client ;
    char *message;
    char buffer[1024] = {0};
    char *hello = "Hello from server";
    //Create socket
    socket_desc = socket(AF_INET , SOCK_STREAM , 0);
    if (socket_desc == -1)
    {
        printf("Could not create socket");
    }

    //Prepare the sockaddr_in structure
    server.sin_family = AF_INET;
    server.sin_addr.s_addr = INADDR_ANY;
    server.sin_port = htons( 8888 );

    //Bind
    if( bind(socket_desc,(struct sockaddr *)&server , sizeof(server)) < 0)
    {
        puts("bind failed");
    }
    puts("bind done");

    //Listen
    listen(socket_desc , 3);

    //Accept and incoming connection
    puts("Waiting for incoming connections...");
    c = sizeof(struct sockaddr_in);
    new_socket = accept(socket_desc, (struct sockaddr *)&client, (socklen_t*)&c);
    if (new_socket<0)
    {
        perror("accept failed");
    }

    puts("Connection accepted\n");

    valread = read(new_socket, buffer, 1024);
    printf("%s\n", buffer);
 send(new_socket, hello, strlen(hello),0);
    printf("Socket: Sent data!\n");

    write(new_socket, "Some message", 1024);

    return 0;
}

Всякий раз, когда я запускаю сервер и клиент, я могу подключить их и отправить данные на сервер, но ответ, который будет отправлен обратно, не может быть декодирован клиентом и дает мне следующий вызов трассировки...

Sending "This is the message. It will be repeated."
Traceback (most recent call last):
  File "pythonclient.py", line 35, in <module>
    client_program()
  File "pythonclient.py", line 25, in client_program
    text += data.decode().strip()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfb in position 44: invalid start byte
-1
источник поделиться
2 ответа

Я протестировал ваш Client.py и, похоже, работает хорошо, но когда я отправляю hex 0xfb, программа так 0xfb, поэтому я думаю, что ваша часть сервера отправляет неверные данные, которые не находятся в формате utf-8.

Я предлагаю вам поставить код отладки следующим образом:

data = b''.join(iter(read_socket, b''))
print(bytes(data))
text += data.decode().strip()

поэтому вы можете увидеть, какие байты вы отправили, и найти недопустимые данные, которые отправляет ваш сервер.

+2
источник
write(new_socket, "Some message", 1024);

Поскольку "Некоторое сообщение" меньше 1024 байта, сервер отправляет "Некоторое сообщение", а затем удаляет данные клиенту, то есть все, что находится в памяти после этого буфера сообщений, до тех пор, пока не будет достигнута длина 1024 байта. Вероятность того, что данные мусора содержат байтовые комбинации, которые недействительны utf-8, в этом случае приложение Python не сможет декодировать данные как UTF-8.

+1
источник

Посмотрите другие вопросы по меткам или Задайте вопрос